Valgrind suppression for OS X 10.9
[alexxy/gromacs.git] / src / gromacs / fft / fft5d.h
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 2009,2010,2012,2013,2014, by the GROMACS development team, led by
5  * Mark Abraham, David van der Spoel, Berk Hess, and Erik Lindahl,
6  * and including many others, as listed in the AUTHORS file in the
7  * top-level source directory and at http://www.gromacs.org.
8  *
9  * GROMACS is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public License
11  * as published by the Free Software Foundation; either version 2.1
12  * of the License, or (at your option) any later version.
13  *
14  * GROMACS is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with GROMACS; if not, see
21  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
22  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
23  *
24  * If you want to redistribute modifications to GROMACS, please
25  * consider that scientific software is very special. Version
26  * control is crucial - bugs must be traceable. We will be happy to
27  * consider code for inclusion in the official distribution, but
28  * derived work must not be called official GROMACS. Details are found
29  * in the README & COPYING files - if they are missing, get the
30  * official version at http://www.gromacs.org.
31  *
32  * To help us fund GROMACS development, we humbly ask that you cite
33  * the research papers on the package. Check out http://www.gromacs.org.
34  */
35
36 #ifndef FFT5D_H_
37 #define FFT5D_H_
38
39 #ifdef HAVE_CONFIG_H
40 #include <config.h>
41 #endif
42
43 #ifdef NOGMX
44 /*#define GMX_MPI*/
45 /*#define GMX_FFT_FFTW3*/
46 FILE* debug;
47 #endif
48
49 #include "gromacs/fft/fft.h"
50 #include "gromacs/math/gmxcomplex.h"
51 #include "gromacs/utility/gmxmpi.h"
52
53 #ifndef GMX_MPI
54 double MPI_Wtime();
55 #endif
56
57 /*currently only special optimization for FFTE*/
58 #ifdef GMX_FFT_FFTW3
59 #include <fftw3.h>
60 #endif
61
62 #ifndef GMX_DOUBLE
63 #define FFTW(x) fftwf_ ## x
64 #else
65 #define FFTW(x) fftw_ ## x
66 #endif
67
68 #ifdef NOGMX
69 #ifdef __cplusplus
70 extern "C" {
71 #endif
72 struct fft5d_time_t {
73     double fft, local, mpi1, mpi2;
74 };
75 typedef struct fft5d_time_t *fft5d_time;
76 #else
77 #include "gromacs/timing/wallcycle.h"
78 #ifdef __cplusplus
79 extern "C" {
80 #endif
81 typedef gmx_wallcycle_t fft5d_time;
82 #endif
83
84 typedef enum fft5d_flags_t {
85     FFT5D_ORDER_YZ    = 1,
86     FFT5D_BACKWARD    = 2,
87     FFT5D_REALCOMPLEX = 4,
88     FFT5D_DEBUG       = 8,
89     FFT5D_NOMEASURE   = 16,
90     FFT5D_INPLACE     = 32,
91     FFT5D_NOMALLOC    = 64
92 } fft5d_flags;
93
94 struct fft5d_plan_t {
95     t_complex *lin;
96     t_complex *lout, *lout2, *lout3;
97     gmx_fft_t* p1d[3]; /*1D plans*/
98 #ifdef GMX_FFT_FFTW3
99     FFTW(plan) p2d;    /*2D plan: used for 1D decomposition if FFT supports transposed output*/
100     FFTW(plan) p3d;    /*3D plan: used for 0D decomposition if FFT supports transposed output*/
101     FFTW(plan) mpip[2];
102 #endif
103     MPI_Comm cart[2];
104
105     int      N[3], M[3], K[3];                        /*local length in transposed coordinate system (if not divisisable max)*/
106     int      pN[3], pM[3], pK[3];                     /*local length - not max but length for this processor*/
107     int      oM[3], oK[3];                            /*offset for current processor*/
108     int     *iNin[3], *oNin[3], *iNout[3], *oNout[3]; /*size for each processor (if divisisable=max) for out(=split)
109                                                          and in (=join) and offsets in transposed coordinate system*/
110     int      C[3], rC[3];                             /*global length (of the one global axes) */
111     /* C!=rC for real<->complex. then C=rC/2 but with potential padding*/
112     int      P[2];                                    /*size of processor grid*/
113 /*  int fftorder;*/
114 /*  int direction;*/
115 /*  int realcomplex;*/
116     int flags;
117     /*int N0,N1,M0,M1,K0,K1;*/
118     int NG, MG, KG;
119     /*int P[2];*/
120     int coor[2];
121     int nthreads;
122 };
123
124 typedef struct fft5d_plan_t *fft5d_plan;
125
126 void fft5d_execute(fft5d_plan plan, int thread, fft5d_time times);
127 fft5d_plan fft5d_plan_3d(int N, int M, int K, MPI_Comm comm[2], int flags, t_complex**lin, t_complex**lin2, t_complex**lout2, t_complex**lout3, int nthreads);
128 void fft5d_local_size(fft5d_plan plan, int* N1, int* M0, int* K0, int* K1, int** coor);
129 void fft5d_destroy(fft5d_plan plan);
130 fft5d_plan fft5d_plan_3d_cart(int N, int M, int K, MPI_Comm comm, int P0, int flags, t_complex** lin, t_complex** lin2, t_complex** lout2, t_complex** lout3, int nthreads);
131 void fft5d_compare_data(const t_complex* lin, const t_complex* in, fft5d_plan plan, int bothLocal, int normarlize);
132
133 #ifdef __cplusplus
134 }
135 #endif
136 #endif /*FFTLIB_H_*/