Create math module
[alexxy/gromacs.git] / src / gromacs / math / utilities.c
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 1991-2000, University of Groningen, The Netherlands.
5  * Copyright (c) 2001-2004, The GROMACS development team.
6  * Copyright (c) 2013,2014, by the GROMACS development team, led by
7  * Mark Abraham, David van der Spoel, Berk Hess, and Erik Lindahl,
8  * and including many others, as listed in the AUTHORS file in the
9  * top-level source directory and at http://www.gromacs.org.
10  *
11  * GROMACS is free software; you can redistribute it and/or
12  * modify it under the terms of the GNU Lesser General Public License
13  * as published by the Free Software Foundation; either version 2.1
14  * of the License, or (at your option) any later version.
15  *
16  * GROMACS is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Lesser General Public License for more details.
20  *
21  * You should have received a copy of the GNU Lesser General Public
22  * License along with GROMACS; if not, see
23  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
24  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
25  *
26  * If you want to redistribute modifications to GROMACS, please
27  * consider that scientific software is very special. Version
28  * control is crucial - bugs must be traceable. We will be happy to
29  * consider code for inclusion in the official distribution, but
30  * derived work must not be called official GROMACS. Details are found
31  * in the README & COPYING files - if they are missing, get the
32  * official version at http://www.gromacs.org.
33  *
34  * To help us fund GROMACS development, we humbly ask that you cite
35  * the research papers on the package. Check out http://www.gromacs.org.
36  */
37 #include "gromacs/math/utilities.h"
38
39 #ifdef HAVE_CONFIG_H
40 #include <config.h>
41 #endif
42
43 #include <math.h>
44 #include <limits.h>
45 #ifdef HAVE__FINITE
46 #include <float.h>
47 #endif
48
49 int gmx_nint(real a)
50 {
51     const real half = .5;
52     int        result;
53
54     result = (a < 0.) ? ((int)(a - half)) : ((int)(a + half));
55     return result;
56 }
57
58 real cuberoot(real x)
59 {
60     if (x < 0)
61     {
62         return (-pow(-x, 1.0/DIM));
63     }
64     else
65     {
66         return (pow(x, 1.0/DIM));
67     }
68 }
69
70 real sign(real x, real y)
71 {
72     if (y < 0)
73     {
74         return -fabs(x);
75     }
76     else
77     {
78         return +fabs(x);
79     }
80 }
81
82 /* Double and single precision erf() and erfc() from
83  * the Sun Freely Distributable Math Library FDLIBM.
84  * See http://www.netlib.org/fdlibm
85  * Specific file used: s_erf.c, version 1.3 95/01/18
86  */
87 /*
88  * ====================================================
89  * Copyright (C) 1993 by Sun Microsystems, Inc. All rights reserved.
90  *
91  * Developed at SunSoft, a Sun Microsystems, Inc. business.
92  * Permission to use, copy, modify, and distribute this
93  * software is freely granted, provided that this notice
94  * is preserved.
95  * ====================================================
96  */
97
98 #if ( (defined SIZEOF_INT && SIZEOF_INT == 4) || (SIZEOF_INT_MAX == 2147483647) )
99 typedef int erf_int32_t;
100 typedef unsigned int erf_u_int32_t;
101 #elif (LONG_MAX == 2147483647L)
102 typedef long erf_int32_t;
103 typedef unsigned long erf_u_int32_t;
104 #elif (SHRT_MAX == 2147483647)
105 typedef short erf_int32_t;
106 typedef unsigned short erf_u_int32_t;
107 #else
108 #  error ERROR: No 32 bit wide integer type found!
109 #endif
110
111
112 static const double
113     tiny        = 1e-300,
114     half        =  5.00000000000000000000e-01, /* 0x3FE00000, 0x00000000 */
115     one         =  1.00000000000000000000e+00, /* 0x3FF00000, 0x00000000 */
116     two         =  2.00000000000000000000e+00, /* 0x40000000, 0x00000000 */
117 /* c = (float)0.84506291151 */
118     erx =  8.45062911510467529297e-01,         /* 0x3FEB0AC1, 0x60000000 */
119 /*
120  * Coefficients for approximation to  erf on [0,0.84375]
121  */
122     efx  =  1.28379167095512586316e-01,        /* 0x3FC06EBA, 0x8214DB69 */
123     efx8 =  1.02703333676410069053e+00,        /* 0x3FF06EBA, 0x8214DB69 */
124     pp0  =  1.28379167095512558561e-01,        /* 0x3FC06EBA, 0x8214DB68 */
125     pp1  = -3.25042107247001499370e-01,        /* 0xBFD4CD7D, 0x691CB913 */
126     pp2  = -2.84817495755985104766e-02,        /* 0xBF9D2A51, 0xDBD7194F */
127     pp3  = -5.77027029648944159157e-03,        /* 0xBF77A291, 0x236668E4 */
128     pp4  = -2.37630166566501626084e-05,        /* 0xBEF8EAD6, 0x120016AC */
129     qq1  =  3.97917223959155352819e-01,        /* 0x3FD97779, 0xCDDADC09 */
130     qq2  =  6.50222499887672944485e-02,        /* 0x3FB0A54C, 0x5536CEBA */
131     qq3  =  5.08130628187576562776e-03,        /* 0x3F74D022, 0xC4D36B0F */
132     qq4  =  1.32494738004321644526e-04,        /* 0x3F215DC9, 0x221C1A10 */
133     qq5  = -3.96022827877536812320e-06,        /* 0xBED09C43, 0x42A26120 */
134 /*
135  * Coefficients for approximation to  erf  in [0.84375,1.25]
136  */
137     pa0  = -2.36211856075265944077e-03,        /* 0xBF6359B8, 0xBEF77538 */
138     pa1  =  4.14856118683748331666e-01,        /* 0x3FDA8D00, 0xAD92B34D */
139     pa2  = -3.72207876035701323847e-01,        /* 0xBFD7D240, 0xFBB8C3F1 */
140     pa3  =  3.18346619901161753674e-01,        /* 0x3FD45FCA, 0x805120E4 */
141     pa4  = -1.10894694282396677476e-01,        /* 0xBFBC6398, 0x3D3E28EC */
142     pa5  =  3.54783043256182359371e-02,        /* 0x3FA22A36, 0x599795EB */
143     pa6  = -2.16637559486879084300e-03,        /* 0xBF61BF38, 0x0A96073F */
144     qa1  =  1.06420880400844228286e-01,        /* 0x3FBB3E66, 0x18EEE323 */
145     qa2  =  5.40397917702171048937e-01,        /* 0x3FE14AF0, 0x92EB6F33 */
146     qa3  =  7.18286544141962662868e-02,        /* 0x3FB2635C, 0xD99FE9A7 */
147     qa4  =  1.26171219808761642112e-01,        /* 0x3FC02660, 0xE763351F */
148     qa5  =  1.36370839120290507362e-02,        /* 0x3F8BEDC2, 0x6B51DD1C */
149     qa6  =  1.19844998467991074170e-02,        /* 0x3F888B54, 0x5735151D */
150 /*
151  * Coefficients for approximation to  erfc in [1.25,1/0.35]
152  */
153     ra0  = -9.86494403484714822705e-03,        /* 0xBF843412, 0x600D6435 */
154     ra1  = -6.93858572707181764372e-01,        /* 0xBFE63416, 0xE4BA7360 */
155     ra2  = -1.05586262253232909814e+01,        /* 0xC0251E04, 0x41B0E726 */
156     ra3  = -6.23753324503260060396e+01,        /* 0xC04F300A, 0xE4CBA38D */
157     ra4  = -1.62396669462573470355e+02,        /* 0xC0644CB1, 0x84282266 */
158     ra5  = -1.84605092906711035994e+02,        /* 0xC067135C, 0xEBCCABB2 */
159     ra6  = -8.12874355063065934246e+01,        /* 0xC0545265, 0x57E4D2F2 */
160     ra7  = -9.81432934416914548592e+00,        /* 0xC023A0EF, 0xC69AC25C */
161     sa1  =  1.96512716674392571292e+01,        /* 0x4033A6B9, 0xBD707687 */
162     sa2  =  1.37657754143519042600e+02,        /* 0x4061350C, 0x526AE721 */
163     sa3  =  4.34565877475229228821e+02,        /* 0x407B290D, 0xD58A1A71 */
164     sa4  =  6.45387271733267880336e+02,        /* 0x40842B19, 0x21EC2868 */
165     sa5  =  4.29008140027567833386e+02,        /* 0x407AD021, 0x57700314 */
166     sa6  =  1.08635005541779435134e+02,        /* 0x405B28A3, 0xEE48AE2C */
167     sa7  =  6.57024977031928170135e+00,        /* 0x401A47EF, 0x8E484A93 */
168     sa8  = -6.04244152148580987438e-02,        /* 0xBFAEEFF2, 0xEE749A62 */
169 /*
170  * Coefficients for approximation to  erfc in [1/.35,28]
171  */
172     rb0  = -9.86494292470009928597e-03,        /* 0xBF843412, 0x39E86F4A */
173     rb1  = -7.99283237680523006574e-01,        /* 0xBFE993BA, 0x70C285DE */
174     rb2  = -1.77579549177547519889e+01,        /* 0xC031C209, 0x555F995A */
175     rb3  = -1.60636384855821916062e+02,        /* 0xC064145D, 0x43C5ED98 */
176     rb4  = -6.37566443368389627722e+02,        /* 0xC083EC88, 0x1375F228 */
177     rb5  = -1.02509513161107724954e+03,        /* 0xC0900461, 0x6A2E5992 */
178     rb6  = -4.83519191608651397019e+02,        /* 0xC07E384E, 0x9BDC383F */
179     sb1  =  3.03380607434824582924e+01,        /* 0x403E568B, 0x261D5190 */
180     sb2  =  3.25792512996573918826e+02,        /* 0x40745CAE, 0x221B9F0A */
181     sb3  =  1.53672958608443695994e+03,        /* 0x409802EB, 0x189D5118 */
182     sb4  =  3.19985821950859553908e+03,        /* 0x40A8FFB7, 0x688C246A */
183     sb5  =  2.55305040643316442583e+03,        /* 0x40A3F219, 0xCEDF3BE6 */
184     sb6  =  4.74528541206955367215e+02,        /* 0x407DA874, 0xE79FE763 */
185     sb7  = -2.24409524465858183362e+01;        /* 0xC03670E2, 0x42712D62 */
186
187 double gmx_erfd(double x)
188 {
189
190     erf_int32_t hx, ix, i;
191     double      R, S, P, Q, s, y, z, r;
192
193     union
194     {
195         double d;
196         int    i[2];
197     }
198     conv;
199
200     conv.d = x;
201
202     /* In release-4-6 and later branches, only the test for
203      * GMX_IEEE754_BIG_ENDIAN_WORD_ORDER will be required. */
204 #if defined(IEEE754_BIG_ENDIAN_WORD_ORDER) || defined(GMX_IEEE754_BIG_ENDIAN_WORD_ORDER)
205     hx = conv.i[0];
206 #else
207     hx = conv.i[1];
208 #endif
209
210     ix = hx&0x7fffffff;
211     if (ix >= 0x7ff00000)
212     {
213         /* erf(nan)=nan */
214         i = ((erf_u_int32_t)hx>>31)<<1;
215         return (double)(1-i)+one/x; /* erf(+-inf)=+-1 */
216     }
217
218     if (ix < 0x3feb0000)
219     {
220         /* |x|<0.84375 */
221         if (ix < 0x3e300000)
222         {
223             /* |x|<2**-28 */
224             if (ix < 0x00800000)
225             {
226                 return 0.125*(8.0*x+efx8*x);  /*avoid underflow */
227             }
228             return x + efx*x;
229         }
230         z = x*x;
231         r = pp0+z*(pp1+z*(pp2+z*(pp3+z*pp4)));
232         s = one+z*(qq1+z*(qq2+z*(qq3+z*(qq4+z*qq5))));
233         y = r/s;
234         return x + x*y;
235     }
236     if (ix < 0x3ff40000)
237     {
238         /* 0.84375 <= |x| < 1.25 */
239         s = fabs(x)-one;
240         P = pa0+s*(pa1+s*(pa2+s*(pa3+s*(pa4+s*(pa5+s*pa6)))));
241         Q = one+s*(qa1+s*(qa2+s*(qa3+s*(qa4+s*(qa5+s*qa6)))));
242         if (hx >= 0)
243         {
244             return erx + P/Q;
245         }
246         else
247         {
248             return -erx - P/Q;
249         }
250     }
251     if (ix >= 0x40180000)
252     {
253         /* inf>|x|>=6 */
254         if (hx >= 0)
255         {
256             return one-tiny;
257         }
258         else
259         {
260             return tiny-one;
261         }
262     }
263     x = fabs(x);
264     s = one/(x*x);
265     if (ix < 0x4006DB6E)
266     {
267         /* |x| < 1/0.35 */
268         R = ra0+s*(ra1+s*(ra2+s*(ra3+s*(ra4+s*(ra5+s*(ra6+s*ra7))))));
269         S = one+s*(sa1+s*(sa2+s*(sa3+s*(sa4+s*(sa5+s*(sa6+s*(sa7+s*sa8)))))));
270     }
271     else
272     {
273         /* |x| >= 1/0.35 */
274         R = rb0+s*(rb1+s*(rb2+s*(rb3+s*(rb4+s*(rb5+s*rb6)))));
275         S = one+s*(sb1+s*(sb2+s*(sb3+s*(sb4+s*(sb5+s*(sb6+s*sb7))))));
276     }
277
278     conv.d = x;
279
280     /* In release-4-6 and later branches, only the test for
281      * GMX_IEEE754_BIG_ENDIAN_WORD_ORDER will be required. */
282 #if defined(IEEE754_BIG_ENDIAN_WORD_ORDER) || defined(GMX_IEEE754_BIG_ENDIAN_WORD_ORDER)
283     conv.i[1] = 0;
284 #else
285     conv.i[0] = 0;
286 #endif
287
288     z = conv.d;
289
290     r  =  exp(-z*z-0.5625)*exp((z-x)*(z+x)+R/S);
291     if (hx >= 0)
292     {
293         return one-r/x;
294     }
295     else
296     {
297         return r/x-one;
298     }
299 }
300
301
302 double gmx_erfcd(double x)
303 {
304     erf_int32_t hx, ix;
305     double      R, S, P, Q, s, y, z, r;
306
307     union
308     {
309         double d;
310         int    i[2];
311     }
312     conv;
313
314     conv.d = x;
315
316     /* In release-4-6 and later branches, only the test for
317      * GMX_IEEE754_BIG_ENDIAN_WORD_ORDER will be required. */
318 #if defined(IEEE754_BIG_ENDIAN_WORD_ORDER) || defined(GMX_IEEE754_BIG_ENDIAN_WORD_ORDER)
319     hx = conv.i[0];
320 #else
321     hx = conv.i[1];
322 #endif
323
324     ix = hx&0x7fffffff;
325     if (ix >= 0x7ff00000)
326     {
327         /* erfc(nan)=nan */
328         /* erfc(+-inf)=0,2 */
329         return (double)(((erf_u_int32_t)hx>>31)<<1)+one/x;
330     }
331
332     if (ix < 0x3feb0000)
333     {
334         /* |x|<0.84375 */
335         double r1, r2, s1, s2, s3, z2, z4;
336         if (ix < 0x3c700000)     /* |x|<2**-56 */
337         {
338             return one-x;
339         }
340         z = x*x;
341         r = pp0+z*(pp1+z*(pp2+z*(pp3+z*pp4)));
342         s = one+z*(qq1+z*(qq2+z*(qq3+z*(qq4+z*qq5))));
343         y = r/s;
344         if (hx < 0x3fd00000)
345         {
346             /* x<1/4 */
347             return one-(x+x*y);
348         }
349         else
350         {
351             r  = x*y;
352             r += (x-half);
353             return half - r;
354         }
355     }
356
357     if (ix < 0x3ff40000)
358     {
359         /* 0.84375 <= |x| < 1.25 */
360         s = fabs(x)-one;
361         P = pa0+s*(pa1+s*(pa2+s*(pa3+s*(pa4+s*(pa5+s*pa6)))));
362         Q = one+s*(qa1+s*(qa2+s*(qa3+s*(qa4+s*(qa5+s*qa6)))));
363         if (hx >= 0)
364         {
365             z  = one-erx; return z - P/Q;
366         }
367         else
368         {
369             z = erx+P/Q; return one+z;
370         }
371     }
372     if (ix < 0x403c0000)
373     {
374         /* |x|<28 */
375         x = fabs(x);
376         s = one/(x*x);
377         if (ix < 0x4006DB6D)
378         {
379             /* |x| < 1/.35 ~ 2.857143*/
380             R = ra0+s*(ra1+s*(ra2+s*(ra3+s*(ra4+s*(ra5+s*(ra6+s*ra7))))));
381             S = one+s*(sa1+s*(sa2+s*(sa3+s*(sa4+s*(sa5+s*(sa6+s*(sa7+s*sa8)))))));
382         }
383         else
384         {
385             /* |x| >= 1/.35 ~ 2.857143 */
386             if (hx < 0 && ix >= 0x40180000)
387             {
388                 return two-tiny; /* x < -6 */
389             }
390             R = rb0+s*(rb1+s*(rb2+s*(rb3+s*(rb4+s*(rb5+s*rb6)))));
391             S = one+s*(sb1+s*(sb2+s*(sb3+s*(sb4+s*(sb5+s*(sb6+s*sb7))))));
392         }
393
394         conv.d = x;
395
396         /* In release-4-6 and later branches, only the test for
397          * GMX_IEEE754_BIG_ENDIAN_WORD_ORDER will be required. */
398 #if defined(IEEE754_BIG_ENDIAN_WORD_ORDER) || defined(GMX_IEEE754_BIG_ENDIAN_WORD_ORDER)
399         conv.i[1] = 0;
400 #else
401         conv.i[0] = 0;
402 #endif
403
404         z = conv.d;
405
406         r  =  exp(-z*z-0.5625)*exp((z-x)*(z+x)+R/S);
407
408         if (hx > 0)
409         {
410             return r/x;
411         }
412         else
413         {
414             return two-r/x;
415         }
416     }
417     else
418     {
419         if (hx > 0)
420         {
421             return tiny*tiny;
422         }
423         else
424         {
425             return two-tiny;
426         }
427     }
428 }
429
430
431 static const float
432     tinyf =  1e-30,
433     halff =  5.0000000000e-01, /* 0x3F000000 */
434     onef  =  1.0000000000e+00, /* 0x3F800000 */
435     twof  =  2.0000000000e+00, /* 0x40000000 */
436 /* c = (subfloat)0.84506291151 */
437     erxf =  8.4506291151e-01,  /* 0x3f58560b */
438 /*
439  * Coefficients for approximation to  erf on [0,0.84375]
440  */
441     efxf  =  1.2837916613e-01, /* 0x3e0375d4 */
442     efx8f =  1.0270333290e+00, /* 0x3f8375d4 */
443     pp0f  =  1.2837916613e-01, /* 0x3e0375d4 */
444     pp1f  = -3.2504209876e-01, /* 0xbea66beb */
445     pp2f  = -2.8481749818e-02, /* 0xbce9528f */
446     pp3f  = -5.7702702470e-03, /* 0xbbbd1489 */
447     pp4f  = -2.3763017452e-05, /* 0xb7c756b1 */
448     qq1f  =  3.9791721106e-01, /* 0x3ecbbbce */
449     qq2f  =  6.5022252500e-02, /* 0x3d852a63 */
450     qq3f  =  5.0813062117e-03, /* 0x3ba68116 */
451     qq4f  =  1.3249473704e-04, /* 0x390aee49 */
452     qq5f  = -3.9602282413e-06, /* 0xb684e21a */
453 /*
454  * Coefficients for approximation to  erf  in [0.84375,1.25]
455  */
456     pa0f = -2.3621185683e-03,  /* 0xbb1acdc6 */
457     pa1f =  4.1485610604e-01,  /* 0x3ed46805 */
458     pa2f = -3.7220788002e-01,  /* 0xbebe9208 */
459     pa3f =  3.1834661961e-01,  /* 0x3ea2fe54 */
460     pa4f = -1.1089469492e-01,  /* 0xbde31cc2 */
461     pa5f =  3.5478305072e-02,  /* 0x3d1151b3 */
462     pa6f = -2.1663755178e-03,  /* 0xbb0df9c0 */
463     qa1f =  1.0642088205e-01,  /* 0x3dd9f331 */
464     qa2f =  5.4039794207e-01,  /* 0x3f0a5785 */
465     qa3f =  7.1828655899e-02,  /* 0x3d931ae7 */
466     qa4f =  1.2617121637e-01,  /* 0x3e013307 */
467     qa5f =  1.3637083583e-02,  /* 0x3c5f6e13 */
468     qa6f =  1.1984500103e-02,  /* 0x3c445aa3 */
469 /*
470  * Coefficients for approximation to  erfc in [1.25,1/0.35]
471  */
472     ra0f = -9.8649440333e-03,  /* 0xbc21a093 */
473     ra1f = -6.9385856390e-01,  /* 0xbf31a0b7 */
474     ra2f = -1.0558626175e+01,  /* 0xc128f022 */
475     ra3f = -6.2375331879e+01,  /* 0xc2798057 */
476     ra4f = -1.6239666748e+02,  /* 0xc322658c */
477     ra5f = -1.8460508728e+02,  /* 0xc3389ae7 */
478     ra6f = -8.1287437439e+01,  /* 0xc2a2932b */
479     ra7f = -9.8143291473e+00,  /* 0xc11d077e */
480     sa1f =  1.9651271820e+01,  /* 0x419d35ce */
481     sa2f =  1.3765776062e+02,  /* 0x4309a863 */
482     sa3f =  4.3456588745e+02,  /* 0x43d9486f */
483     sa4f =  6.4538726807e+02,  /* 0x442158c9 */
484     sa5f =  4.2900814819e+02,  /* 0x43d6810b */
485     sa6f =  1.0863500214e+02,  /* 0x42d9451f */
486     sa7f =  6.5702495575e+00,  /* 0x40d23f7c */
487     sa8f = -6.0424413532e-02,  /* 0xbd777f97 */
488 /*
489  * Coefficients for approximation to  erfc in [1/.35,28]
490  */
491     rb0f = -9.8649431020e-03,  /* 0xbc21a092 */
492     rb1f = -7.9928326607e-01,  /* 0xbf4c9dd4 */
493     rb2f = -1.7757955551e+01,  /* 0xc18e104b */
494     rb3f = -1.6063638306e+02,  /* 0xc320a2ea */
495     rb4f = -6.3756646729e+02,  /* 0xc41f6441 */
496     rb5f = -1.0250950928e+03,  /* 0xc480230b */
497     rb6f = -4.8351919556e+02,  /* 0xc3f1c275 */
498     sb1f =  3.0338060379e+01,  /* 0x41f2b459 */
499     sb2f =  3.2579251099e+02,  /* 0x43a2e571 */
500     sb3f =  1.5367296143e+03,  /* 0x44c01759 */
501     sb4f =  3.1998581543e+03,  /* 0x4547fdbb */
502     sb5f =  2.5530502930e+03,  /* 0x451f90ce */
503     sb6f =  4.7452853394e+02,  /* 0x43ed43a7 */
504     sb7f = -2.2440952301e+01;  /* 0xc1b38712 */
505
506
507 typedef union
508 {
509     float         value;
510     erf_u_int32_t word;
511 } ieee_float_shape_type;
512
513 #define GET_FLOAT_WORD(i, d)                 \
514     do {                                \
515         ieee_float_shape_type gf_u;                   \
516         gf_u.value = (d);                     \
517         (i)        = gf_u.word;                      \
518     } while (0)
519
520
521 #define SET_FLOAT_WORD(d, i)                 \
522     do {                                \
523         ieee_float_shape_type sf_u;                   \
524         sf_u.word = (i);                      \
525         (d)       = sf_u.value;                     \
526     } while (0)
527
528
529 float gmx_erff(float x)
530 {
531     erf_int32_t hx, ix, i;
532     float       R, S, P, Q, s, y, z, r;
533
534     union
535     {
536         float  f;
537         int    i;
538     }
539     conv;
540
541     conv.f = x;
542     hx     = conv.i;
543
544     ix = hx&0x7fffffff;
545     if (ix >= 0x7f800000)
546     {
547         /* erf(nan)=nan */
548         i = ((erf_u_int32_t)hx>>31)<<1;
549         return (float)(1-i)+onef/x; /* erf(+-inf)=+-1 */
550     }
551
552     if (ix < 0x3f580000)
553     {
554         /* |x|<0.84375 */
555         if (ix < 0x31800000)
556         {
557             /* |x|<2**-28 */
558             if (ix < 0x04000000)
559             {
560                 return (float)0.125*((float)8.0*x+efx8f*x);             /*avoid underflow */
561             }
562             return x + efxf*x;
563         }
564         z = x*x;
565         r = pp0f+z*(pp1f+z*(pp2f+z*(pp3f+z*pp4f)));
566         s = onef+z*(qq1f+z*(qq2f+z*(qq3f+z*(qq4f+z*qq5f))));
567         y = r/s;
568         return x + x*y;
569     }
570     if (ix < 0x3fa00000)
571     {
572         /* 0.84375 <= |x| < 1.25 */
573         s = fabs(x)-onef;
574         P = pa0f+s*(pa1f+s*(pa2f+s*(pa3f+s*(pa4f+s*(pa5f+s*pa6f)))));
575         Q = onef+s*(qa1f+s*(qa2f+s*(qa3f+s*(qa4f+s*(qa5f+s*qa6f)))));
576         if (hx >= 0)
577         {
578             return erxf + P/Q;
579         }
580         else
581         {
582             return -erxf - P/Q;
583         }
584     }
585     if (ix >= 0x40c00000)
586     {
587         /* inf>|x|>=6 */
588         if (hx >= 0)
589         {
590             return onef-tinyf;
591         }
592         else
593         {
594             return tinyf-onef;
595         }
596     }
597     x = fabs(x);
598     s = onef/(x*x);
599     if (ix < 0x4036DB6E)
600     {
601         /* |x| < 1/0.35 */
602         R = ra0f+s*(ra1f+s*(ra2f+s*(ra3f+s*(ra4f+s*(ra5f+s*(ra6f+s*ra7f))))));
603         S = onef+s*(sa1f+s*(sa2f+s*(sa3f+s*(sa4f+s*(sa5f+s*(sa6f+s*(sa7f+s*sa8f)))))));
604     }
605     else
606     {
607         /* |x| >= 1/0.35 */
608         R = rb0f+s*(rb1f+s*(rb2f+s*(rb3f+s*(rb4f+s*(rb5f+s*rb6f)))));
609         S = onef+s*(sb1f+s*(sb2f+s*(sb3f+s*(sb4f+s*(sb5f+s*(sb6f+s*sb7f))))));
610     }
611
612     conv.f = x;
613     conv.i = conv.i & 0xfffff000;
614     z      = conv.f;
615
616     r  =  exp(-z*z-(float)0.5625)*exp((z-x)*(z+x)+R/S);
617     if (hx >= 0)
618     {
619         return onef-r/x;
620     }
621     else
622     {
623         return r/x-onef;
624     }
625 }
626
627 float gmx_erfcf(float x)
628 {
629     erf_int32_t hx, ix;
630     float       R, S, P, Q, s, y, z, r;
631
632     union
633     {
634         float  f;
635         int    i;
636     }
637     conv;
638
639     conv.f = x;
640     hx     = conv.i;
641
642     ix = hx&0x7fffffff;
643     if (ix >= 0x7f800000)
644     {
645         /* erfc(nan)=nan */
646         /* erfc(+-inf)=0,2 */
647         return (float)(((erf_u_int32_t)hx>>31)<<1)+onef/x;
648     }
649
650     if (ix < 0x3f580000)
651     {
652         /* |x|<0.84375 */
653         if (ix < 0x23800000)
654         {
655             return onef-x;  /* |x|<2**-56 */
656         }
657         z = x*x;
658         r = pp0f+z*(pp1f+z*(pp2f+z*(pp3f+z*pp4f)));
659         s = onef+z*(qq1f+z*(qq2f+z*(qq3f+z*(qq4f+z*qq5f))));
660         y = r/s;
661         if (hx < 0x3e800000)
662         {
663             /* x<1/4 */
664             return onef-(x+x*y);
665         }
666         else
667         {
668             r  = x*y;
669             r += (x-halff);
670             return halff - r;
671         }
672     }
673     if (ix < 0x3fa00000)
674     {
675         /* 0.84375 <= |x| < 1.25 */
676         s = fabs(x)-onef;
677         P = pa0f+s*(pa1f+s*(pa2f+s*(pa3f+s*(pa4f+s*(pa5f+s*pa6f)))));
678         Q = onef+s*(qa1f+s*(qa2f+s*(qa3f+s*(qa4f+s*(qa5f+s*qa6f)))));
679         if (hx >= 0)
680         {
681             z  = onef-erxf; return z - P/Q;
682         }
683         else
684         {
685             z = erxf+P/Q; return onef+z;
686         }
687     }
688     if (ix < 0x41e00000)
689     {
690         /* |x|<28 */
691         x = fabs(x);
692         s = onef/(x*x);
693         if (ix < 0x4036DB6D)
694         {
695             /* |x| < 1/.35 ~ 2.857143*/
696             R = ra0f+s*(ra1f+s*(ra2f+s*(ra3f+s*(ra4f+s*(ra5f+s*(ra6f+s*ra7f))))));
697             S = onef+s*(sa1f+s*(sa2f+s*(sa3f+s*(sa4f+s*(sa5f+s*(sa6f+s*(sa7f+s*sa8f)))))));
698         }
699         else
700         {
701             /* |x| >= 1/.35 ~ 2.857143 */
702             if (hx < 0 && ix >= 0x40c00000)
703             {
704                 return twof-tinyf;                     /* x < -6 */
705             }
706             R = rb0f+s*(rb1f+s*(rb2f+s*(rb3f+s*(rb4f+s*(rb5f+s*rb6f)))));
707             S = onef+s*(sb1f+s*(sb2f+s*(sb3f+s*(sb4f+s*(sb5f+s*(sb6f+s*sb7f))))));
708         }
709
710         conv.f = x;
711         conv.i = conv.i & 0xfffff000;
712         z      = conv.f;
713
714         r  =  exp(-z*z-(float)0.5625)*exp((z-x)*(z+x)+R/S);
715         if (hx > 0)
716         {
717             return r/x;
718         }
719         else
720         {
721             return twof-r/x;
722         }
723     }
724     else
725     {
726         if (hx > 0)
727         {
728             return tinyf*tinyf;
729         }
730         else
731         {
732             return twof-tinyf;
733         }
734     }
735 }
736
737
738 gmx_bool gmx_isfinite(real gmx_unused x)
739 {
740     gmx_bool returnval = TRUE;
741     /* If no suitable function was found, assume the value is
742      * finite. */
743
744 #ifdef HAVE__FINITE
745     returnval = _finite(x);
746 #elif defined HAVE_ISFINITE
747     returnval = isfinite(x);
748 #elif defined HAVE__ISFINITE
749     returnval = _isfinite(x);
750 #endif
751     return returnval;
752 }
753
754 gmx_bool gmx_isnan(real x)
755 {
756     /* cppcheck-suppress duplicateExpression */
757     return x != x;
758 }
759
760 int
761 gmx_within_tol(double   f1,
762                double   f2,
763                double   tol)
764 {
765     /* The or-equal is important - otherwise we return false if f1==f2==0 */
766     if (fabs(f1-f2) <= tol*0.5*(fabs(f1)+fabs(f2)) )
767     {
768         return 1;
769     }
770     else
771     {
772         return 0;
773     }
774 }
775
776 int
777 gmx_numzero(double a)
778 {
779     return gmx_within_tol(a, 0.0, GMX_REAL_MIN/GMX_REAL_EPS);
780 }
781
782 real
783 gmx_log2(real x)
784 {
785     const real iclog2 = 1.0/log( 2.0 );
786
787     return log( x ) * iclog2;
788 }
789
790 gmx_bool
791 check_int_multiply_for_overflow(gmx_int64_t  a,
792                                 gmx_int64_t  b,
793                                 gmx_int64_t *result)
794 {
795     gmx_int64_t sign = 1;
796     if ((0 == a) || (0 == b))
797     {
798         *result = 0;
799         return TRUE;
800     }
801     if (a < 0)
802     {
803         a    = -a;
804         sign = -sign;
805     }
806     if (b < 0)
807     {
808         b    = -b;
809         sign = -sign;
810     }
811     if (GMX_INT64_MAX / b < a)
812     {
813         *result = (sign > 0) ? GMX_INT64_MAX : GMX_INT64_MIN;
814         return FALSE;
815     }
816     *result = sign * a * b;
817     return TRUE;
818 }
819
820 int gmx_greatest_common_divisor(int p, int q)
821 {
822     int tmp;
823     while (q != 0)
824     {
825         tmp = q;
826         q   = p % q;
827         p   = tmp;
828     }
829     return p;
830 }