Merge release-4-6 into master
[alexxy/gromacs.git] / src / gromacs / gmxlib / main.cpp
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 1991-2000, University of Groningen, The Netherlands.
5  * Copyright (c) 2001-2004, The GROMACS development team.
6  * Copyright (c) 2013,2014, by the GROMACS development team, led by
7  * Mark Abraham, David van der Spoel, Berk Hess, and Erik Lindahl,
8  * and including many others, as listed in the AUTHORS file in the
9  * top-level source directory and at http://www.gromacs.org.
10  *
11  * GROMACS is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU Lesser General Public License
13  * as published by the Free Software Foundation; either version 2.1
14  * of the License, or (at your option) any later version.
15  *
16  * GROMACS is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Lesser General Public License for more details.
20  *
21  * You should have received a copy of the GNU Lesser General Public
22  * License along with GROMACS; if not, see
23  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
24  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
25  *
26  * If you want to redistribute modifications to GROMACS, please
27  * consider that scientific software is very special. Version
28  * control is crucial - bugs must be traceable. We will be happy to
29  * consider code for inclusion in the official distribution, but
30  * derived work must not be called official GROMACS. Details are found
31  * in the README & COPYING files - if they are missing, get the
32  * official version at http://www.gromacs.org.
33  *
34  * To help us fund GROMACS development, we humbly ask that you cite
35  * the research papers on the package. Check out http://www.gromacs.org.
36  */
37 #ifdef HAVE_CONFIG_H
38 #include <config.h>
39 #endif
40
41 #include <stdio.h>
42 #include <stdlib.h>
43 #include <string.h>
44 #include <limits.h>
45 #include <time.h>
46
47 #ifdef HAVE_SYS_TIME_H
48 #include <sys/time.h>
49 #endif
50
51 #include "smalloc.h"
52 #include "gmx_fatal.h"
53 #include "network.h"
54 #include "main.h"
55 #include "macros.h"
56 #include "gromacs/fileio/futil.h"
57 #include "gromacs/fileio/filenm.h"
58 #include "gromacs/fileio/gmxfio.h"
59 #include "string2.h"
60 #include "copyrite.h"
61
62 #include "gromacs/utility/exceptions.h"
63 #include "gromacs/utility/gmxmpi.h"
64 #include "gromacs/utility/programcontext.h"
65
66 /* The source code in this file should be thread-safe.
67          Please keep it that way. */
68
69
70 #ifdef HAVE_UNISTD_H
71 #include <unistd.h>
72 #endif
73
74 #ifdef GMX_NATIVE_WINDOWS
75 #include <process.h>
76 #endif
77
78 #define BUFSIZE 1024
79
80
81 static void par_fn(char *base, int ftp, const t_commrec *cr,
82                    gmx_bool bAppendSimId, gmx_bool bAppendNodeId,
83                    char buf[], int bufsize)
84 {
85     if ((size_t)bufsize < (strlen(base)+10))
86     {
87         gmx_mem("Character buffer too small!");
88     }
89
90     /* Copy to buf, and strip extension */
91     strcpy(buf, base);
92     buf[strlen(base) - strlen(ftp2ext(fn2ftp(base))) - 1] = '\0';
93
94     if (bAppendSimId)
95     {
96         sprintf(buf+strlen(buf), "%d", cr->ms->sim);
97     }
98     if (bAppendNodeId)
99     {
100         strcat(buf, "_node");
101         sprintf(buf+strlen(buf), "%d", cr->nodeid);
102     }
103     strcat(buf, ".");
104
105     /* Add extension again */
106     strcat(buf, (ftp == efTPX) ? "tpr" : (ftp == efEDR) ? "edr" : ftp2ext(ftp));
107     if (debug)
108     {
109         fprintf(debug, "node %d par_fn '%s'\n", cr->nodeid, buf);
110         if (fn2ftp(buf) == efLOG)
111         {
112             fprintf(debug, "log\n");
113         }
114     }
115 }
116
117 void check_multi_int(FILE *log, const gmx_multisim_t *ms, int val,
118                      const char *name,
119                      gmx_bool bQuiet)
120 {
121     int     *ibuf, p;
122     gmx_bool bCompatible;
123
124     if (NULL != log && !bQuiet)
125     {
126         fprintf(log, "Multi-checking %s ... ", name);
127     }
128
129     if (ms == NULL)
130     {
131         gmx_fatal(FARGS,
132                   "check_multi_int called with a NULL communication pointer");
133     }
134
135     snew(ibuf, ms->nsim);
136     ibuf[ms->sim] = val;
137     gmx_sumi_sim(ms->nsim, ibuf, ms);
138
139     bCompatible = TRUE;
140     for (p = 1; p < ms->nsim; p++)
141     {
142         bCompatible = bCompatible && (ibuf[p-1] == ibuf[p]);
143     }
144
145     if (bCompatible)
146     {
147         if (NULL != log && !bQuiet)
148         {
149             fprintf(log, "OK\n");
150         }
151     }
152     else
153     {
154         if (NULL != log)
155         {
156             fprintf(log, "\n%s is not equal for all subsystems\n", name);
157             for (p = 0; p < ms->nsim; p++)
158             {
159                 fprintf(log, "  subsystem %d: %d\n", p, ibuf[p]);
160             }
161         }
162         gmx_fatal(FARGS, "The %d subsystems are not compatible\n", ms->nsim);
163     }
164
165     sfree(ibuf);
166 }
167
168 void check_multi_int64(FILE *log, const gmx_multisim_t *ms,
169                        gmx_int64_t val, const char *name,
170                        gmx_bool bQuiet)
171 {
172     gmx_int64_t      *ibuf;
173     int               p;
174     gmx_bool          bCompatible;
175
176     if (NULL != log && !bQuiet)
177     {
178         fprintf(log, "Multi-checking %s ... ", name);
179     }
180
181     if (ms == NULL)
182     {
183         gmx_fatal(FARGS,
184                   "check_multi_int called with a NULL communication pointer");
185     }
186
187     snew(ibuf, ms->nsim);
188     ibuf[ms->sim] = val;
189     gmx_sumli_sim(ms->nsim, ibuf, ms);
190
191     bCompatible = TRUE;
192     for (p = 1; p < ms->nsim; p++)
193     {
194         bCompatible = bCompatible && (ibuf[p-1] == ibuf[p]);
195     }
196
197     if (bCompatible)
198     {
199         if (NULL != log && !bQuiet)
200         {
201             fprintf(log, "OK\n");
202         }
203     }
204     else
205     {
206         if (NULL != log)
207         {
208             fprintf(log, "\n%s is not equal for all subsystems\n", name);
209             for (p = 0; p < ms->nsim; p++)
210             {
211                 char strbuf[255];
212                 /* first make the format string */
213                 snprintf(strbuf, 255, "  subsystem %%d: %s\n",
214                          "%" GMX_PRId64);
215                 fprintf(log, strbuf, p, ibuf[p]);
216             }
217         }
218         gmx_fatal(FARGS, "The %d subsystems are not compatible\n", ms->nsim);
219     }
220
221     sfree(ibuf);
222 }
223
224
225 int gmx_gethostname(char *name, size_t len)
226 {
227     if (len < 8)
228     {
229         gmx_incons("gmx_gethostname called with len<8");
230     }
231 #if defined(HAVE_UNISTD_H) && !defined(__native_client__)
232     if (gethostname(name, len-1) != 0)
233     {
234         strncpy(name, "unknown", 8);
235         return -1;
236     }
237     return 0;
238 #else
239     strncpy(name, "unknown", 8);
240     return -1;
241 #endif
242 }
243
244
245 void gmx_log_open(const char *lognm, const t_commrec *cr, gmx_bool bMasterOnly,
246                   gmx_bool bAppendFiles, FILE** fplog)
247 {
248     int    len, pid;
249     char   buf[256], host[256];
250     time_t t;
251     char   timebuf[STRLEN];
252     FILE  *fp = *fplog;
253     char  *tmpnm;
254
255     debug_gmx();
256
257     /* Communicate the filename for logfile */
258     if (cr->nnodes > 1 && !bMasterOnly
259 #ifdef GMX_THREAD_MPI
260         /* With thread MPI the non-master log files are opened later
261          * when the files names are already known on all nodes.
262          */
263         && FALSE
264 #endif
265         )
266     {
267         if (MASTER(cr))
268         {
269             len = strlen(lognm) + 1;
270         }
271         gmx_bcast(sizeof(len), &len, cr);
272         if (!MASTER(cr))
273         {
274             snew(tmpnm, len+8);
275         }
276         else
277         {
278             tmpnm = gmx_strdup(lognm);
279         }
280         gmx_bcast(len*sizeof(*tmpnm), tmpnm, cr);
281     }
282     else
283     {
284         tmpnm = gmx_strdup(lognm);
285     }
286
287     debug_gmx();
288
289     if (!bMasterOnly && !MASTER(cr))
290     {
291         /* Since log always ends with '.log' let's use this info */
292         par_fn(tmpnm, efLOG, cr, FALSE, !bMasterOnly, buf, 255);
293         fp = gmx_fio_fopen(buf, bAppendFiles ? "a+" : "w+" );
294     }
295     else if (!bAppendFiles)
296     {
297         fp = gmx_fio_fopen(tmpnm, bAppendFiles ? "a+" : "w+" );
298     }
299
300     sfree(tmpnm);
301
302     gmx_fatal_set_log_file(fp);
303
304     /* Get some machine parameters */
305     gmx_gethostname(host, 256);
306
307     time(&t);
308
309 #ifndef NO_GETPID
310 #   ifdef GMX_NATIVE_WINDOWS
311     pid = _getpid();
312 #   else
313     pid = getpid();
314 #   endif
315 #else
316     pid = 0;
317 #endif
318
319     if (bAppendFiles)
320     {
321         fprintf(fp,
322                 "\n"
323                 "\n"
324                 "-----------------------------------------------------------\n"
325                 "Restarting from checkpoint, appending to previous log file.\n"
326                 "\n"
327                 );
328     }
329
330     gmx_ctime_r(&t, timebuf, STRLEN);
331
332     fprintf(fp,
333             "Log file opened on %s"
334             "Host: %s  pid: %d  nodeid: %d  nnodes:  %d\n",
335             timebuf, host, pid, cr->nodeid, cr->nnodes);
336     try
337     {
338         gmx::BinaryInformationSettings settings;
339         settings.extendedInfo(true);
340         settings.copyright(!bAppendFiles);
341         gmx::printBinaryInformation(fp, gmx::getProgramContext(), settings);
342     }
343     GMX_CATCH_ALL_AND_EXIT_WITH_FATAL_ERROR;
344     fprintf(fp, "\n\n");
345
346     fflush(fp);
347     debug_gmx();
348
349     *fplog = fp;
350 }
351
352 void gmx_log_close(FILE *fp)
353 {
354     if (fp)
355     {
356         gmx_fatal_set_log_file(NULL);
357         gmx_fio_fclose(fp);
358     }
359 }
360
361 void init_multisystem(t_commrec *cr, int nsim, char **multidirs,
362                       int nfile, const t_filenm fnm[], gmx_bool bParFn)
363 {
364     gmx_multisim_t *ms;
365     int             nnodes, nnodpersim, sim, i, ftp;
366     char            buf[256];
367 #ifdef GMX_MPI
368     MPI_Group       mpi_group_world;
369     int            *rank;
370 #endif
371
372 #ifndef GMX_MPI
373     if (nsim > 1)
374     {
375         gmx_fatal(FARGS, "This binary is compiled without MPI support, can not do multiple simulations.");
376     }
377 #endif
378
379     nnodes  = cr->nnodes;
380     if (nnodes % nsim != 0)
381     {
382         gmx_fatal(FARGS, "The number of nodes (%d) is not a multiple of the number of simulations (%d)", nnodes, nsim);
383     }
384
385     nnodpersim = nnodes/nsim;
386     sim        = cr->nodeid/nnodpersim;
387
388     if (debug)
389     {
390         fprintf(debug, "We have %d simulations, %d nodes per simulation, local simulation is %d\n", nsim, nnodpersim, sim);
391     }
392
393     snew(ms, 1);
394     cr->ms   = ms;
395     ms->nsim = nsim;
396     ms->sim  = sim;
397 #ifdef GMX_MPI
398     /* Create a communicator for the master nodes */
399     snew(rank, ms->nsim);
400     for (i = 0; i < ms->nsim; i++)
401     {
402         rank[i] = i*nnodpersim;
403     }
404     MPI_Comm_group(MPI_COMM_WORLD, &mpi_group_world);
405     MPI_Group_incl(mpi_group_world, nsim, rank, &ms->mpi_group_masters);
406     sfree(rank);
407     MPI_Comm_create(MPI_COMM_WORLD, ms->mpi_group_masters,
408                     &ms->mpi_comm_masters);
409
410 #if !defined(MPI_IN_PLACE_EXISTS)
411     /* initialize the MPI_IN_PLACE replacement buffers */
412     snew(ms->mpb, 1);
413     ms->mpb->ibuf        = NULL;
414     ms->mpb->libuf       = NULL;
415     ms->mpb->fbuf        = NULL;
416     ms->mpb->dbuf        = NULL;
417     ms->mpb->ibuf_alloc  = 0;
418     ms->mpb->libuf_alloc = 0;
419     ms->mpb->fbuf_alloc  = 0;
420     ms->mpb->dbuf_alloc  = 0;
421 #endif
422
423 #endif
424
425     /* Reduce the intra-simulation communication */
426     cr->sim_nodeid = cr->nodeid % nnodpersim;
427     cr->nnodes     = nnodpersim;
428 #ifdef GMX_MPI
429     MPI_Comm_split(MPI_COMM_WORLD, sim, cr->sim_nodeid, &cr->mpi_comm_mysim);
430     cr->mpi_comm_mygroup = cr->mpi_comm_mysim;
431     cr->nodeid           = cr->sim_nodeid;
432 #endif
433
434     if (debug)
435     {
436         fprintf(debug, "This is simulation %d", cr->ms->sim);
437         if (PAR(cr))
438         {
439             fprintf(debug, ", local number of nodes %d, local nodeid %d",
440                     cr->nnodes, cr->sim_nodeid);
441         }
442         fprintf(debug, "\n\n");
443     }
444
445     if (multidirs)
446     {
447         if (debug)
448         {
449             fprintf(debug, "Changing to directory %s\n", multidirs[cr->ms->sim]);
450         }
451         gmx_chdir(multidirs[cr->ms->sim]);
452     }
453     else if (bParFn)
454     {
455         /* Patch output and tpx, cpt and rerun input file names */
456         for (i = 0; (i < nfile); i++)
457         {
458             /* Because of possible multiple extensions per type we must look
459              * at the actual file name
460              */
461             if (is_output(&fnm[i]) ||
462                 fnm[i].ftp == efTPX || fnm[i].ftp == efCPT ||
463                 strcmp(fnm[i].opt, "-rerun") == 0)
464             {
465                 ftp = fn2ftp(fnm[i].fns[0]);
466                 par_fn(fnm[i].fns[0], ftp, cr, TRUE, FALSE, buf, 255);
467                 sfree(fnm[i].fns[0]);
468                 fnm[i].fns[0] = gmx_strdup(buf);
469             }
470         }
471     }
472 }