Added GPU local wait to load balancing
[alexxy/gromacs.git] / src / gromacs / timing / wallcycle.h
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 1991-2000, University of Groningen, The Netherlands.
5  * Copyright (c) 2001-2008, The GROMACS development team.
6  * Copyright (c) 2013,2014, by the GROMACS development team, led by
7  * Mark Abraham, David van der Spoel, Berk Hess, and Erik Lindahl,
8  * and including many others, as listed in the AUTHORS file in the
9  * top-level source directory and at http://www.gromacs.org.
10  *
11  * GROMACS is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU Lesser General Public License
13  * as published by the Free Software Foundation; either version 2.1
14  * of the License, or (at your option) any later version.
15  *
16  * GROMACS is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Lesser General Public License for more details.
20  *
21  * You should have received a copy of the GNU Lesser General Public
22  * License along with GROMACS; if not, see
23  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
24  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
25  *
26  * If you want to redistribute modifications to GROMACS, please
27  * consider that scientific software is very special. Version
28  * control is crucial - bugs must be traceable. We will be happy to
29  * consider code for inclusion in the official distribution, but
30  * derived work must not be called official GROMACS. Details are found
31  * in the README & COPYING files - if they are missing, get the
32  * official version at http://www.gromacs.org.
33  *
34  * To help us fund GROMACS development, we humbly ask that you cite
35  * the research papers on the package. Check out http://www.gromacs.org.
36  */
37 #ifndef GMX_TIMING_WALLCYCLE_H
38 #define GMX_TIMING_WALLCYCLE_H
39
40 #include <stdio.h>
41 #include "gromacs/legacyheaders/typedefs.h"
42 #include "gromacs/legacyheaders/types/commrec.h"
43
44 #ifdef __cplusplus
45 extern "C" {
46 #endif
47
48 enum {
49     ewcRUN, ewcSTEP, ewcPPDURINGPME, ewcDOMDEC, ewcDDCOMMLOAD,
50     ewcDDCOMMBOUND, ewcVSITECONSTR, ewcPP_PMESENDX, ewcNS, ewcLAUNCH_GPU_NB,
51     ewcMOVEX, ewcGB, ewcFORCE, ewcMOVEF, ewcPMEMESH,
52     ewcPME_REDISTXF, ewcPME_SPREADGATHER, ewcPME_FFT, ewcPME_FFTCOMM, ewcLJPME, ewcPME_SOLVE,
53     ewcPMEWAITCOMM, ewcPP_PMEWAITRECVF, ewcWAIT_GPU_NB_NL, ewcWAIT_GPU_NB_L, ewcWAIT_GPU_NB_L_EST, ewcNB_XF_BUF_OPS,
54     ewcVSITESPREAD, ewcPULLPOT,
55     ewcTRAJ, ewcUPDATE, ewcCONSTR, ewcMoveE, ewcROT, ewcROTadd, ewcSWAP, ewcIMD,
56     ewcTEST, ewcNR
57 };
58
59
60 enum {
61     ewcsDD_REDIST, ewcsDD_GRID, ewcsDD_SETUPCOMM,
62     ewcsDD_MAKETOP, ewcsDD_MAKECONSTR, ewcsDD_TOPOTHER,
63     ewcsNBS_GRID_LOCAL, ewcsNBS_GRID_NONLOCAL,
64     ewcsNBS_SEARCH_LOCAL, ewcsNBS_SEARCH_NONLOCAL,
65     ewcsBONDED, ewcsNONBONDED, ewcsEWALD_CORRECTION,
66     ewcsNB_X_BUF_OPS, ewcsNB_F_BUF_OPS,
67     ewcsNR
68 };
69
70 gmx_bool wallcycle_have_counter(void);
71 /* Returns if cycle counting is supported */
72
73 gmx_wallcycle_t wallcycle_init(FILE *fplog, int resetstep, t_commrec *cr,
74                                int nthreads_pp, int nthreads_pme);
75 /* Returns the wall cycle structure.
76  * Returns NULL when cycle counting is not supported.
77  */
78
79 void wallcycle_start(gmx_wallcycle_t wc, int ewc);
80 /* Starts the cycle counter (and increases the call count) */
81
82 void wallcycle_start_nocount(gmx_wallcycle_t wc, int ewc);
83 /* Starts the cycle counter without increasing the call count */
84
85 double wallcycle_stop(gmx_wallcycle_t wc, int ewc);
86 /* Stop the cycle count for ewc, returns the last cycle count */
87
88 void wallcycle_reset_all(gmx_wallcycle_t wc);
89 /* Resets all cycle counters to zero */
90
91 void wallcycle_sum(t_commrec *cr, gmx_wallcycle_t wc);
92 /* Sum the cycles over the nodes in cr->mpi_comm_mysim */
93
94 void wallcycle_print(FILE *fplog, int nnodes, int npme, double realtime,
95                      gmx_wallcycle_t wc, wallclock_gpu_t *gpu_t);
96 /* Print the cycle and time accounting */
97
98 gmx_int64_t wcycle_get_reset_counters(gmx_wallcycle_t wc);
99 /* Return reset_counters from wc struct */
100
101 void wcycle_set_reset_counters(gmx_wallcycle_t wc, gmx_int64_t reset_counters);
102 /* Set reset_counters */
103
104 void wallcycle_sub_start(gmx_wallcycle_t wc, int ewcs);
105 /* Set the start sub cycle count for ewcs */
106
107 void wallcycle_sub_stop(gmx_wallcycle_t wc, int ewcs);
108 /* Stop the sub cycle count for ewcs */
109
110 #ifdef __cplusplus
111 }
112 #endif
113
114 #endif