alexxy/gromacs.git
8 years agoFix -deffnm -multi[dir]
Teemu Murtola [Thu, 9 Jul 2015 14:21:15 +0000 (17:21 +0300)]
Fix -deffnm -multi[dir]

Make -deffnm work even when all other functionality in
FileNameOptionManager is disabled (which happens with -multi and
-multidir).  Add a test for the broken case.

Fixes #1769.

Change-Id: I0f729eaa1ab6e9a4a25d1d121cbfe5b5b2673e4b

8 years agoMerge release-5-0 into release-5-1
Roland Schulz [Wed, 8 Jul 2015 07:35:13 +0000 (03:35 -0400)]
Merge release-5-0 into release-5-1

Conflicts:
src/gromacs/gmxana/gmx_dos.c

Change-Id: I06208bcafb880b9bac3f45050d709fae5eab9a9d

8 years agoMerge release-4-6 into release-5-0
Roland Schulz [Wed, 8 Jul 2015 07:28:27 +0000 (03:28 -0400)]
Merge release-4-6 into release-5-0

Change-Id: I25fea1226adfaa332c5c7b0630e99031266178f4

8 years agoFirst 5.1 release candidate
Mark Abraham [Mon, 29 Jun 2015 22:49:57 +0000 (00:49 +0200)]
First 5.1 release candidate

Change-Id: I89776d6dd4d170d4f259fa8ee761cf4f6878cbe0

8 years agoFix too small GPU pair count estimates
Berk Hess [Wed, 1 Jul 2015 13:46:40 +0000 (15:46 +0200)]
Fix too small GPU pair count estimates

For triclinic unit-cells with DD the non-local cluster pair count
estimate was too high, especially for thin local domains, due to an
incorrect estimate of the cluster size. Since the pair count estimate
for the local pair-list was determined as a total minus a non-local
estimate, the local estimate could get negative and cause exceptions.
Fixed the cluster size estimate and added a lower limit for the local
size estimate.

Fixes #1762.

Change-Id: I3489550968f66bc03ba4e6056017a58eba37f7cc

8 years agoFix bug in GPU list balancing
Berk Hess [Sat, 4 Jul 2015 08:18:05 +0000 (10:18 +0200)]
Fix bug in GPU list balancing

The function split_sci_entry could produce empty lists. This seems
not to have caused incorrect results, only slight extra processing
of empty workunits in the CUDA kernel. Incorrect Coulomb energies
could appear for empty lists with shift=CENTRAL, but that does not
seem to happen.

Refs #1767.

Change-Id: I0b0ff0a450734d4863f1e9636ff5741d4f1a68da

8 years agoFix DD DLB state issue
Berk Hess [Thu, 2 Jul 2015 14:03:34 +0000 (16:03 +0200)]
Fix DD DLB state issue

The introduction of DLB locking for PME load balancing added another
DLB state, which was stored in a third variable. These variables
were not always all properly checked. Simplified the code by merging
these three state variables into one. In added there was a fourth
variable (bGridJump) is gmx_domdec_t, this is replaced by calls to
a functions returning is DLB is on.

Refs #1760.

Change-Id: I80d499149e4e5bfd689e76208384a8ba61e2842a

8 years agoFix bug in GPU list balancing
Berk Hess [Fri, 3 Jul 2015 20:28:52 +0000 (22:28 +0200)]
Fix bug in GPU list balancing

The function split_sci_entry could produce empty lists, which can
cause illegal memory access or incorrect energies. Before commit
6106367b this bug was never triggered, since nsp_max was never smaller
than a full cj4 entry. But 6106367b introduced a but that could
produce negative nsp_max.

Fixes #1767.

Change-Id: I2007cf6851f94f4f2ca62f609a0628725014dbe7

8 years agoFix copy-paste bug in gmx distance
Teemu Murtola [Sat, 4 Jul 2015 17:45:11 +0000 (20:45 +0300)]
Fix copy-paste bug in gmx distance

The -oxyz option did not behave properly (the computed values should be
fine, but the behavior of where the output goes can be unpredictable).

Change-Id: Idcd389c3809189f85a630094b9aaea6d61a5f954

8 years agoObey OpenMP thread count limit with tMPI
Berk Hess [Thu, 2 Jul 2015 08:09:43 +0000 (10:09 +0200)]
Obey OpenMP thread count limit with tMPI

With thread-MPI mdrun would choose the number of OpenMP threads so
that the maximal number of hardware threads was used. When the number
of ranks was limited by the system size, this led to too high OpenMP
thread counts which lowered the efficiency. Now a limit is imposed.
Also updated some comments and renamed constants and bNTOptSet.

Change-Id: I830b5a3f2fd28f87acfbcf982103b62fc3e45758

8 years agoFix two PME DLB trigger issues
Berk Hess [Wed, 1 Jul 2015 13:04:13 +0000 (15:04 +0200)]
Fix two PME DLB trigger issues

Dynamic load balancing got triggered while locked by PME load
balancing, because a check was placed incorrectly.
PME load balancing would never trigger with separate PME ranks
because a comparison was inverted.

Fixes #1760.
Fixes #1763.

Change-Id: I75eeb32423b864f84bfd45ecb61d169b473ed74a

8 years agoFix ThreadMPI GPU assumptions
Mark Abraham [Thu, 2 Jul 2015 14:57:10 +0000 (16:57 +0200)]
Fix ThreadMPI GPU assumptions

The OpenCL implementation introduces the constraint of one GPU per
node, but thread-MPI still assumed any compatible GPU was available
for use and thus should have a rank.

Consolidated the configure-time constants behind some API functions so
that we can use the same behaviour in the various setup code.

Added a warning message that the OpenCL implementation has to waste a
GPU, stopped showing another warning message related to wasting
GPUs when the OpenCL implemenation forces this, and improved
another message to clarify why gmx mdrun -ntmpi 2 won't work
with OpenCL.

Also fixed a few references to thread-MPI threads that are better
called thread-MPI ranks.

Change-Id: I4664c49786ebd26a53cbf5e1c26df79649ba4f5f

8 years agoCorrect grompp pull warning message
Berk Hess [Thu, 2 Jul 2015 12:05:26 +0000 (14:05 +0200)]
Correct grompp pull warning message

A warning full pull-coord?-groups referred to pull-coord?-geometry
instead. This is fixed by changing the order of proceses the pull
options, which better reflects the dependencies. Also reordered
the options in the mdp manual.

Change-Id: I6309d021282156cd3409af35bcfa38dc2cab1c67

8 years agoFix OpenCL compilation errors.
Szilard Pall [Wed, 1 Jul 2015 14:49:09 +0000 (16:49 +0200)]
Fix OpenCL compilation errors.

Fixes a typo in a structure. Also fixes an incorrect
variable name only visible on OS X.

Fixes #1765

Change-Id: I0ee0f61da1f036163aa85f719ef9ceb0dab06868

8 years agoRemove status messages about Sphinx detection
Teemu Murtola [Wed, 1 Jul 2015 03:21:41 +0000 (06:21 +0300)]
Remove status messages about Sphinx detection

Make FindSphinx.cmake and FindPythonModule.cmake respect the QUIET
option, and pass that to find_package() to not print out information on
every CMake run.  Most people will not care whether these are found or
not, and being silent in all cases is the same approach as is used for
Doxygen.

In master, it could be useful to change at least some of the documentation
build rules such that they require GMX_DEVELOPER_BUILD to be set, and
that could also enable messages about not finding the components needed
for the documentation build, but that is outside the scope of this
change.

Fixes part of #1761 and #1764.

Change-Id: I196f5e66c94fe4247ae28bd230a469acbaad939a

8 years agoFix inconsistent OpenMP automation
Berk Hess [Tue, 30 Jun 2015 19:22:01 +0000 (21:22 +0200)]
Fix inconsistent OpenMP automation

The thread MPI single rank max thread count for non-Intel was 6,
this was smaller than the max allowed MPI+OpenMP thread count of 8,
which caused setups to be generated that did not pass the check.
Increased 6 to 8 and added an assertion.

Change-Id: I13787616d7c667cba3245da4f5b5c3a1a6a1206d

8 years agoDocument how to add and use NVML support
Mark Abraham [Mon, 20 Apr 2015 22:13:17 +0000 (00:13 +0200)]
Document how to add and use NVML support

Change-Id: I8ca7c5d1b163a78559a048ca6cc5b099f34c6cd6

8 years agoAvoid GPU data race also with OpenCL
Mark Abraham [Mon, 29 Jun 2015 22:32:52 +0000 (00:32 +0200)]
Avoid GPU data race also with OpenCL

Implements the same change to non-local stream synchronization as now
used for CUDA.

Fixes #1756

Change-Id: I720edc0951f97dcff0bd477084fff45a149f01d9

8 years agoenabled 1 PP + 1 PME node
Berk Hess [Tue, 5 Aug 2014 10:07:36 +0000 (12:07 +0200)]
enabled 1 PP + 1 PME node

Change-Id: I18a4c2bac71f1b5b81d9d374b212bfb9edc7a1e8

8 years agoAdd checks for inefficient resource usage
Berk Hess [Fri, 24 Apr 2015 13:27:27 +0000 (15:27 +0200)]
Add checks for inefficient resource usage

Checks have been added for using too many OpenMP threads and when
using GPUs for using single OpenMP thread. A fatal error is generated
in case where we are quite sure performance is very sub-optimal. This
is nasty, but a fatal error is the only way to ensure that users don't
ignore this warning. The fatal error can be circumvented by explicitly
setting -ntomp, in that case a note is printed to log and stderr.

Now also avoids ranks counts with thread-MPI that don't fit with the
total number of threads requested.

With a GPU without DD thread count limit is now doubled.

Disabled GPU sharing with OpenCL.

Change-Id: Ib2d892dbac3d5716246fbfdb2e8f246cdc169787

8 years agoAdd support for flushing WDDM queue
Mark Abraham [Wed, 25 Mar 2015 13:41:40 +0000 (14:41 +0100)]
Add support for flushing WDDM queue

Relevant only with CUDA on Windows (and profiling?)

On Windows the WDDM driver (default for non-Tesla) can prevent
immediate submission of CUDA tasks to the GPU in an attempt
to try to amortize driver overheads. However, as we need
tasks to start immediately for optimal concurrent execution,
this "feature" will result in large overheads. A well-
documented workaround is implemented by this change.

Change-Id: I69a6bb59dc8cae18fba539de49c977c0ee814d07

8 years agoMerge "Merge branch release-5-0"
Mark Abraham [Mon, 29 Jun 2015 20:25:11 +0000 (22:25 +0200)]
Merge "Merge branch release-5-0"

8 years agoFix OS X openCL builds
Erik Lindahl [Sat, 27 Jun 2015 12:16:53 +0000 (14:16 +0200)]
Fix OS X openCL builds

OS X does not like the quotes previously used to handle
OpenCL include paths with spaces - escape them instead.
With this change, OpenCL works at least on Yosemite
(OS X 10.10) using a GeForce  GT 750M card, and passes
all Gromacs regression tests.

Change-Id: I2acd30256e2ff11ca1fde10361cc0cc55ee7fc05

8 years agoFix bugs in gmx dos
Erik Lindahl [Thu, 25 Jun 2015 15:46:05 +0000 (11:46 -0400)]
Fix bugs in gmx dos

- Velocity autocorrelations were not normalized
  by default, so they did not agree with gmx velacc.
- The normalize option had no effect on the VACs.
- The index group option was available, but no
  index groups were processed.
- Since the DoS is calculated from the mass-weighted
  VAC and by default only from the real part, it was
  not clear why these results would differ from data
  obtained with gmx velacc. There is at least a note
  about this now, and more docs will be added in the
  future.
- The hidden option to dump some plots has been
  removed since it was not documented what these
  contained (beyond a paper reference), and the
  contents was not based on any data from the
  trajectory, but rather plotting a custom function.

Fixes #1608.

Change-Id: Icfca060f94efb34bd7871bd90245ab0ddbbe91c1

8 years agoReplace functions deprecated in OpenCL 1.2
Erik Lindahl [Thu, 25 Jun 2015 19:01:26 +0000 (15:01 -0400)]
Replace functions deprecated in OpenCL 1.2

Check for CL_VERSION_1_2 in the source, and
use newer versions in that case to avoid
warnings about deprecated functions.

Change-Id: I6f70e0178fa06c59be57168d94aae0fd7df148f5

8 years agoOnly accept exact matches for selection keywords
Teemu Murtola [Mon, 29 Jun 2015 17:48:33 +0000 (20:48 +0300)]
Only accept exact matches for selection keywords

The selection parser tried to be nice to the user and also accept
unambiguous prefixes of keywords, but this also has a lot of side
effects that can be confusing (e.g., it was impossible to create
variables that had names that were prefixes to keywords or to other
variable names).  Additionally, this was the only case where user input
could cause an exception during tokenization of the input string, and
that wasn't handled very well during interactive input, either (it
caused the whole program to stop, instead of just reporting the error
like is done for other parsing errors).

Remove the logic, and only make the parser accept exact matches.
Add a few synonyms for keywords where there is a natural abbreviation.

Change-Id: I6041baa2f5a3b7dab87c3d5991e883d2d74ace66

8 years agoMerge branch release-5-0
Mark Abraham [Mon, 29 Jun 2015 18:52:12 +0000 (20:52 +0200)]
Merge branch release-5-0

Conflicts:

src/gromacs/gmxpreprocess/hackblock.c
  Used new name for header file for gmx_warning.

src/gromacs/mdlib/nbnxn_cuda/nbnxn_cuda.cu
  Moved code to the other side of the sync point as
  in release-5-0. Renamed cu_nb to nb.

src/gromacs/mdlib/nbnxn_cuda/nbnxn_cuda_data_mgmt.cu
  Changed name of event to destroy. Renamed cu_nb to nb.

Change-Id: Iee9e2ea372ee704057a4a51ad9e4ab9a22ab7fe6

8 years agoDocumented build types in developer guide
Mark Abraham [Mon, 29 Jun 2015 11:04:12 +0000 (13:04 +0200)]
Documented build types in developer guide

Change-Id: I9212c0399b59c69845f20322b7d8ace3de0b61c5

8 years agoMerge release-4-6 into release-5-0
Mark Abraham [Mon, 29 Jun 2015 14:43:51 +0000 (16:43 +0200)]
Merge release-4-6 into release-5-0

Conflicts:

  src/gmxlib/nonbonded/nb_free_energy.c
Deleted - change already exists in release-5-0

  src/gromacs/mdlib/nbnxn_cuda/nbnxn_cuda.cu
Applied same reordering to the (unchanged) release-5-0 code

  src/mdlib/nbnxn_cuda/nbnxn_cuda_types.h
Renamed misc_ops_and_local_H2D_done, and added Doxygen for it

Change-Id: I4c34d168af347a59b7821da6fea71a4715ec5bae

8 years agoImplement OpenCL support
anca [Sat, 10 Jan 2015 21:41:39 +0000 (23:41 +0200)]
Implement OpenCL support

StreamComputing (http://www.streamcomputing.eu) has implemented the
short-ranged non-bonded interaction accleration features previously
accelerated with CUDA using OpenCL 1.1. Supported devices include
GCN-based AMD GPUs and NVIDIA GPUs.

Compilation requires an OpenCL SDK installed. This is included in
the CUDA SDK in that case.

The overall project is not complete, but Gromacs runs correctly on
supported devices. It only runs fast on AMD devices, because of a
limitation in the Nvidia driver. A list of known TODO items can be
found in docs/OpenCLTODOList.txt. Only devices with a warp/wavefront
size that is a multiple of 32 are compatible with the implementation.

Known issues include that tabulated Ewald kernels do not work (but the
analytical kernels are on by default, as with CUDA), and the blocking
behaviour of clEnqueue in Nvidia drivers means no overlap of CPU and
GPU computation occurs. Concerns about concurrency correctness with
context management, JIT compilation, and JIT caching means several
features are disabled for now. FastGen is enabled by default, so the
JIT compilation will only compile kernels needed for the current
simulation.

There is some duplication between the two GPU implementations, but
the active development expected for both of them suggests it is
not worthwhile consolidating the implementations more closely.

Change-Id: Ideaf16929028eb60e785feb8298c08e917394d0f

8 years agoAdd MSAN build type
Mark Abraham [Wed, 9 Jul 2014 13:50:17 +0000 (15:50 +0200)]
Add MSAN build type

This permits GROMACS to build with Memory Sanitizer in clang >= 3.4.

Refactored the tests that linking to libxml2 and zlib work, which is
simpler to follow now that there are three paths. The new MSAN path is
useful because making try_compile tests work with MSAN is tricky, and
only useful for very few developers.

Fixed a missing header exposed by using a different C++ library.

Documented use in the deveoper guide

Change-Id: Ia3e8077ac732386563eebfa54f2f7d71ebd74a33

8 years agoFix bug removing multiple dihedrals in main rtp entries
Erik Lindahl [Tue, 23 Jun 2015 20:20:00 +0000 (16:20 -0400)]
Fix bug removing multiple dihedrals in main rtp entries

The Gromacs-5.0 series has had a serious bug where pdb2gmx
would only consider the first entry when several explicit
bonds were listed for the same atoms in an RTP entry. Older
topologies have worked fine.

Fixes #1704, #1755.

Change-Id: I0b34aeb905dab8ea66196cabc0745583ef6d7209

8 years agoFix all use of nbnxn_simd.h
Mark Abraham [Thu, 25 Jun 2015 20:46:51 +0000 (22:46 +0200)]
Fix all use of nbnxn_simd.h

Added nbnxn_simd.h to the set of SIMD headers for which we do
per-commit testing for correct use.

Fixed a bunch of files that were acquiring the dependency
transitively, which is error-prone.

Change-Id: Ic8fb462c7790a5e723f901700dd06fd09543e58a

8 years agoMake some unit tests skip file system access
Teemu Murtola [Wed, 24 Jun 2015 09:16:54 +0000 (12:16 +0300)]
Make some unit tests skip file system access

Make unit tests for FileNameOptionManager not use the file system.
Introduce a FileInputRedirectorInterface to support mocking file
existence checks, and use a mock implementation in the tests.

These particular tests did quite a bit of file system access, and the
speedup is only a few ms, although significant percentually (something
like 80%).  But there can be tests where this has more effect, and this
approach provides a starting point for more work on eliminating
unnecessary file system access from the tests.

The main benefit is clearer and more robust test code, as it is no
longer necessary to construct actual files and ensure that they do not
conflict with other tests or cause issues if the test crashes or such.

Change-Id: Ib9a171331e988fa7e74b16078164f477f8296c6e

8 years agoRemoved gmx protonate tool
Erik Lindahl [Sun, 28 Jun 2015 12:47:08 +0000 (14:47 +0200)]
Removed gmx protonate tool

This tool appears to have been largely unused, since
testing shows it crashes for a normal trajectory all
the way back to 4.6. Since it is only relevant for
united-atom force fields, we'll reduce the maintenance
load by simply removing it for now - it might reappear
in the future.

Refs #1618.

Change-Id: If57e250f0ffbe32bcc948d09b54b225db9724c35

8 years agoImprove DLB+PME tuning with GPUs
Berk Hess [Mon, 4 Aug 2014 15:51:03 +0000 (17:51 +0200)]
Improve DLB+PME tuning with GPUs

With GPUs and the DD DLB can quickly limit the PME load balancing
room too much. In such cases (and only with DLB=auto) we now first
do PME load balancing without DLB and then, if DLB gets turned on,
a second round of PME load balancing.

Also fixed that when DLB limited the tuning, the fastest choice was
reset, which would often lead to stronger limitations.

Change-Id: I0087e6b8512d5574d8d0fa2db82e6e38279a82f1

8 years agoFix CUDA inter-stream synchronization issue
Szilard Pall [Mon, 29 Jun 2015 01:58:35 +0000 (03:58 +0200)]
Fix CUDA inter-stream synchronization issue

With the introduction of multiple hardware queues in CC 3.5 and later
NVIDIA GPUs, the implicit dependency between tasks in the local and
non-local kernel got eliminated. However, as the misc_ops_done event
that we sync with in the non-local stream preceded the local coordinate
transfer, even though the tasks in the local stream are always issued
first, under rare circumstances the non-local kernel could start before
the local coordinate transfer completes. This would lead to non-local
interactions being calculated using coordinates (and charges) from the
previous step.

This change moves the synchronization point to creating a dependency
between the local coordinate transfer and non-local non-bonded kernel.

Change-Id: I0b3837d46db6469f6b1d9869a3a73b5176d93d99

8 years agoFix double precision reference SIMD and gcc bug
Erik Lindahl [Fri, 5 Jun 2015 06:18:16 +0000 (07:18 +0100)]
Fix double precision reference SIMD and gcc bug

The double precision logical operations on floats were
incorrect for the reference SIMD implementation for C
source, and GCC appears to be buggy with C++, likely
due to strict aliasing assumptions at -O3 interfering
with the required casts - solved by sticking to unions
for now. This might be slower, but the reference
implementation is not used for production anyway.

Change-Id: If048bda298618ae67968861c4a850d080c8cce31

8 years agoFix one error and compiler warnings with Cuda & clang-3.6
Erik Lindahl [Fri, 12 Jun 2015 20:17:47 +0000 (22:17 +0200)]
Fix one error and compiler warnings with Cuda & clang-3.6

Clang-3.6 on OS X can now be used by nvcc. clang found one
error related to || being used instead of | to set flag bits,
and a handful of warnings variables in headers not being used.
The latter is caused by declaring constants in headers, and
making then static to avoid clashing symbols. However, this emits
them in every single compile unit that includes the header. Fixed
by either moving names to a cpp file, or changing to defines.

Change-Id: Ib4d59c40aa8caffc667cc202a3efe45891b2abe3

8 years agoAppend _pullx_ and _pullf to pull files when -deffnm used.
Peter Kasson [Mon, 22 Jun 2015 21:32:26 +0000 (17:32 -0400)]
Append _pullx_ and _pullf to pull files when -deffnm used.

Changes -deffnm behavior for pulling so that the pullx and pullf
files don't collide. Previously, this resulted in one being
backed up and checkpoint restarts failing when -deffnm was used.
(Technically this applies to anything where -px and -pf are identical
 and not explicitly set, but that only happens with -deffnm.)

Additionally return fatal error if -px or -pf set and output files
collide.

Fix is now localized to the pull code.

Fixes #942 except for log file collision with pull-rotation.

Change-Id: I27b8b4ced0f307905e2c2ea4fb260376dd25dc32

8 years agoRemove unused cmake files
Roland Schulz [Sat, 27 Jun 2015 23:20:15 +0000 (19:20 -0400)]
Remove unused cmake files

Change-Id: Id1a132e316539243dafa06a17ae2e8f69dc9f448

8 years agoDon't use check_library for libm
Roland Schulz [Sat, 27 Jun 2015 22:23:50 +0000 (18:23 -0400)]
Don't use check_library for libm

Using check_library doesn't work with build-ins like sqrt
with Werror. sqrt was anyhow only a placeholder for a standard
libm function. We really only need to know whether the library
exists.

Fixes #1750

Change-Id: I6a550cf8c8b8ea985b28130a4339935fb8c9741a

8 years agoImprove pair search thread load balance
Berk Hess [Wed, 10 Jun 2015 08:07:35 +0000 (10:07 +0200)]
Improve pair search thread load balance

With very small systems and many OpenMP threads, especially when
using GPUs, some threads can end up without pair search work. Better
load balancing reduces the pair search time. Also the CPU non-bonded
kernel time is slightly reduced in the extreme parallelization limit.

Change-Id: Ib036ea3ba59f497eeee7afa73a71fb0e0ccd216e

8 years agoImproved the intra-GPU load balancing
Berk Hess [Mon, 3 Nov 2014 16:25:51 +0000 (17:25 +0100)]
Improved the intra-GPU load balancing

The splitting of the pair list to improve load balancing on the GPU
was based on the number of generated lists. But this number can be
high(er) due to small lists before splitting. This lead to too few
lists for small systems and too many for large systems.
Now the splitting is based on the number of pairs in the list up till
now. This produces much more stable results.
Because of the more stable results, we increased the min_ci_balanced
factor from 40 to 44 (closer to the ideal 48).
With small systems on many threads we used to generate many more lists
than targeted. Because the algorithm is now far better, we increased
the minimum list size from 32 to 36 and still get fewer lists.

Change-Id: Id2210171a409ef1a27f7dc919fe806f0fe4d869c

8 years agoFix CUDA architecture dependent issues
Szilard Pall [Wed, 24 Jun 2015 21:19:46 +0000 (23:19 +0200)]
Fix CUDA architecture dependent issues

Only device code gets generated in multiple passes and therefore
target architecture-dependent macros like __CUDA_ARCH__ or our own
IATYPE_SHMEM (which also depends on __CUDA_ARCH__) are not usable in
host code as these will be both undefined. As a result, current code
over-allocated dynamic shared memory. This has no negative side-effect.
This change replaces the use of macros with runtime device compute
capability checks. Also texture objects are now actually enabled,
which give very minor performance improvements.
Note that on Maxwell + CUDA 7.0 there is a 20% performance regression
for the tabulated Ewald kernel (which is not used by default), which
magically disappears when texture references are used instead.

Change-Id: I1f911caad85eb38d6a8e95f3b3923561dbfccd0e

8 years agoFix IBM VSX SIMD compiles with xlc
Erik Lindahl [Fri, 12 Jun 2015 18:49:29 +0000 (20:49 +0200)]
Fix IBM VSX SIMD compiles with xlc

Remove most of the previous inline asm to improve
performance (the optimizer works better w/o asm),
and make sure the VSX SIMD code compiles with XLC.

Change-Id: I3e8e9b4dd6102dd5503210e3b49b844ee5492342

8 years agoReduce the use of nbnxn_consts.h
Berk Hess [Mon, 15 Jun 2015 15:33:54 +0000 (17:33 +0200)]
Reduce the use of nbnxn_consts.h

Removed reference to "half-width SIMD" (got reworked a long time ago)

Change-Id: Ifcf4f8ae7d18ac14dae7c843ffe1b5787a3dbff3

8 years agoCorrected nstcalclr/nstfep/nst_repl_ex checks
Berk Hess [Mon, 25 May 2015 13:54:19 +0000 (15:54 +0200)]
Corrected nstcalclr/nstfep/nst_repl_ex checks

Several checks with twin-range electrostatics still checked for
multiples of nstlist instead of nstcalclr and nst_repl_ex was not
checked at all.
Free-energy with small nstdhdl triggered frequent, unnecessary
neighbor search. It seems this can't have caused isssues with
free-energy, because nstfep needs to be a multiple of nstcalcenergy
which again needs to be a multiple of nstcalclr (was nstlist).

Change-Id: I20b8e8ab8329a3aaf904ddfa21573aee8d58c0e4

8 years agoFix single-prec. softcore issue in 4.6 branch
Erik Lindahl [Sat, 27 Jun 2015 16:11:02 +0000 (18:11 +0200)]
Fix single-prec. softcore issue in 4.6 branch

This is a backport of 412e2974 which we likely
forgot to put in 4.6. It primarily fixes
numerical issues in single precision for
sc_power==48, but it can also improve stability
of lower-power softcore free energy.

This should not be merged into 5.0 or master.

Refs #1580. Fixes #1306.

Change-Id: I5506d714214f0eb7e0517a0eda8d74cdba816dab

8 years agoMerge "Merge release-5-0 into master"
Erik Lindahl [Sat, 27 Jun 2015 10:58:34 +0000 (12:58 +0200)]
Merge "Merge release-5-0 into master"

8 years agoDocument tool changes in 5.1
Teemu Murtola [Tue, 23 Jun 2015 12:20:29 +0000 (15:20 +0300)]
Document tool changes in 5.1

Add documentation for tool changes done in 5.1, and improve the
documentation for some of the previous changes.

Change-Id: If7b194392f4516d9a98de2adcbbd436a9acebd2d

8 years agoMerge release-5-0 into master
Mark Abraham [Fri, 26 Jun 2015 12:53:15 +0000 (14:53 +0200)]
Merge release-5-0 into master

Conflicts:
src/gromacs/mdlib/calc_verletbuf.c
Included nbnxn_simd.h, consistent with fix incoming from release-5-0.

src/programs/mdrun/runner.cpp
One of the changes in release-5-0 was in the -testverlet feature,
which has been removed in master. Other changes applied normally.

Change-Id: Id5b507bce1d6f907e97ac694f02fbe7e486f6208

8 years agoFix compile issues on K computer
Erik Lindahl [Fri, 8 May 2015 07:42:11 +0000 (09:42 +0200)]
Fix compile issues on K computer

Fix a compiler bug in the latest K environment (1.2-17)
related to a bug in the system heaers that we work around
by temporarily altering the ISOC99 define.

Change-Id: Ifd60c7062880ecc81bc704a0695c54c2cb342776

8 years agoFixed Verlet buffer issue with 2-wide SIMD
Berk Hess [Fri, 26 Jun 2015 07:21:22 +0000 (09:21 +0200)]
Fixed Verlet buffer issue with 2-wide SIMD

The Verlet buffer size for CPUs was always calculated for 4x4.
With 2-wide SIMD the estimate should be for 4x2, which results
in a slighly larger list buffer.
grompp now always sets rlist for a 4x4 list setup; mdrun anyhow
redetermines rlist at run time (added a note for this in grompp).

Fixes #1757.

Change-Id: If4bf9ad17b82b22c9d9f7c1dd3f88e66f2314df4

8 years agoMerge release-4-6 into release-5-0
Mark Abraham [Fri, 26 Jun 2015 07:06:01 +0000 (09:06 +0200)]
Merge release-4-6 into release-5-0

Conflicts:
src/gromacs/fileio/strdb.c
src/gromacs/utility/cstringutil.c
These were not actually conflicts; the code changed here was simply
relocated in release-5-0.

src/programs/mdrun/md.c
Trajectory-writing code has moved in release-5-0, so applied some
changes to src/gromacs/fileio/trajectory_writing.c

Uncrustified, copyright bumps.

Change-Id: I11626cbf2a3efa89adf7c975df2a43b4eb3680fb

8 years agoFix buffer size issues in string database
Erik Lindahl [Mon, 22 Jun 2015 12:14:15 +0000 (08:14 -0400)]
Fix buffer size issues in string database

We have cool quotes of the than 255 characters which was the buffer
size of buffers in the string database code. Now the buffers are
extended to STRLEN and an fscanf is replaced by fgets in an
infrequently used routine.

Change-Id: I6cd09e6e33f9a4ff3302fb2e1ab8235e2253e87c

8 years agoFix mdrun -confout sometimes affecting final .edr frame
Mark Abraham [Wed, 24 Jun 2015 14:42:47 +0000 (16:42 +0200)]
Fix mdrun -confout sometimes affecting final .edr frame

This makes a two-part run write .edr files that can be concatenated to
be identical to that from a one-part run. Otherwise, a single-domain
run might make molecules whole, do an update with the modified x
vector, and write a slightly different final .edr frame, even though
the .trr and .cpt (and thus the restart) were still fine.

Allocating an array of natoms rvecs isn't great, but we only need it
at the end of runs in cases where we ran a single domain, so this is
not a scaling bottleneck. Maybe the "optimization" of setting state
equal to state_global in this case is not such a good thing.

Change-Id: I4d1b49e7de0a5c1691084a612b46a10820784307

8 years agoFix recent compilation issue in pullcode
Alexey Shvetsov [Thu, 25 Jun 2015 22:07:08 +0000 (01:07 +0300)]
Fix recent compilation issue in pullcode

Undeclared variable names were used in a code path without
MPI_IN_PLACE_EXISTS. Introduced recently in 581ebdfd.

Change-Id: Ib124b7083a74bb4a3cb3e9971d8975ccf7eb0889

8 years agoFix edr appending and exact continuation
Erik Lindahl [Mon, 22 Jun 2015 15:48:15 +0000 (11:48 -0400)]
Fix edr appending and exact continuation

The nsteps field was not written to checkpoint files when
nstcalcenergy=nstenergy. This caused differences in nsteps
in appended energy files, which in turn caused issues in averages
and RMSD in g_energy (which is now fixed by another patch).
Also added the nsteps_sim field to the checkpoint file for
consistency.

Fixes #1342.

Change-Id: Iff8bf51aaa307a379f0e7cdb7d76d9bafb13cf13

8 years agoIntermolecular bonded interaction support added
Berk Hess [Wed, 21 Aug 2013 15:30:36 +0000 (17:30 +0200)]
Intermolecular bonded interaction support added

The .top file can now contain an [ intermolecular_interactions ]
directive, after which bonded interactions can be entered using
global atom indices.
Added a molecule defition section to the topologies chapter in the
manual. A description of the moleculetype directive was missing.
This section has a subsection on intermolecular interactions.

Change-Id: I383287dd0729fef1c54f27a4fe9f5d628445549c

8 years agoFix binary exact continuation for trajectories
Erik Lindahl [Mon, 22 Jun 2015 12:18:53 +0000 (08:18 -0400)]
Fix binary exact continuation for trajectories

The initial call to compute_globals() after
continuation would remove COM motion, which meant
trajectories would not be exactly (binary)
identical to a single trajectory - it was likely
introduced with the velocity verlet code.

Refs #1342.

Change-Id: I061648774c7625810a8b693c631c61ae377ba297

8 years agoAdd missing macro undef in CUDA NB kernel
Szilard Pall [Wed, 24 Jun 2015 21:16:49 +0000 (23:16 +0200)]
Add missing macro undef in CUDA NB kernel

Harmless as different architecture code-path get generated such that
they don't end up in the same compilation unit, so the two macros
remaining defined did not affect code where the __CUDA_ARCH__ >= 300
is not true.

Change-Id: Ic6911e5c13781ac8a2835c3aef1457df6da60412

8 years agoFix Wundef warnings
Roland Schulz [Fri, 5 Jun 2015 00:34:38 +0000 (20:34 -0400)]
Fix Wundef warnings

Also fixes a performance bug in gmx_simd_invsqrt_pair_d. Previuosly it
did unnecessary number of iterations because it used an non-existing
preprocessor variable.

Change-Id: Idcdf3872b5a169e8690721bbe83922a4ab280da8

8 years agoMove documentation on tool changes from wiki
Teemu Murtola [Tue, 23 Jun 2015 06:49:40 +0000 (09:49 +0300)]
Move documentation on tool changes from wiki

Move the text on tool changes from the wiki page to the user guide,
where it is much easier to maintain together with the code changes.
For now, this only contains the 5.0-era changes more or less directly
from the wiki, but I will improve this (as a separate change) once I
have more time.

Change-Id: I4ccea605783de2949221d604e232b36c726dcaa7

8 years agoMerge "Merge release-5-0 into master"
Mark Abraham [Thu, 25 Jun 2015 16:57:44 +0000 (18:57 +0200)]
Merge "Merge release-5-0 into master"

8 years agoReenabled SIMD kernels without cut-offs
Berk Hess [Wed, 4 Mar 2015 21:46:00 +0000 (22:46 +0100)]
Reenabled SIMD kernels without cut-offs

In 4.6 there was a bug that caused incorrect results with group scheme
SIMD kernels with systems without cut-offs. This seems to have been
resolved already in 5.0.
Refs #1249.

Change-Id: I86c2b2ae097769472c1748e6e03a673a58a938eb

8 years agoMerge release-5-0 into master
Mark Abraham [Thu, 25 Jun 2015 08:47:53 +0000 (10:47 +0200)]
Merge release-5-0 into master

Conflicts:
docs/install-guide/install-guide.md
Applied release-5-0 changes to docs/install-guide/index.rst

docs/manual/install.tex
Applied release-5-0 changes to docs/user-guide/environment-variables.rst

src/gromacs/commandline/cmdlineprogramcontext.cpp
Applied comment from release-5-0

src/gromacs/gmxana/gmx_hbond.c
Removed smooth_tail as in release-5-0

src/gromacs/gmxlib/gmx_detect_hardware.cpp
Removed GMX_MAX_THREADS implementation as in release-5-0
(adjacent changes)

src/gromacs/utility/init.cpp
Combined changes to include statements

src/gromacs/utility/path.cpp
Combined changes to include statements

src/programs/mdrun/mdrun.cpp
Added new please_cite calls from release-5-0 to new call site
in runner.cpp

Change-Id: I5b75b12bb8a49a606b086184017b754477d65068

8 years agoMerge release-4-6 into release-5-0
Mark Abraham [Wed, 24 Jun 2015 21:33:24 +0000 (23:33 +0200)]
Merge release-4-6 into release-5-0

Change-Id: I6cc179f767cc4e0fc1dc3fc0b85428df986c16df

8 years agoAvoid accessing hackblocks for x2top
Erik Lindahl [Tue, 23 Jun 2015 20:43:33 +0000 (16:43 -0400)]
Avoid accessing hackblocks for x2top

Previous fixes for generating dihedrals would cause us to access
the hackblock even when using x2top, which we should not do.

Fixes #1711.

Change-Id: Id0ea6d524d80b87fe257c9fd4f1c48c4be828654

8 years agoUpdate header when appending to TNG file.
Magnus Lundborg [Fri, 27 Mar 2015 11:20:38 +0000 (12:20 +0100)]
Update header when appending to TNG file.

The library now handles updating the size of the headers
by moving the first frame sets to make room (if necessary).
Therefore this is now enabled when appending to a trajectory
from mdrun.

Change-Id: I7334a1b0c251856f30e116b63161f7676055dce1

8 years agoGPU Ewald table kernel now uses CPU spacing
Berk Hess [Mon, 15 Jun 2015 21:56:26 +0000 (23:56 +0200)]
GPU Ewald table kernel now uses CPU spacing

The tabulated Ewald GPU kernels (only used by default on Fermi),
used a fixed table spacing. Now the same adaptive spacing as on the
CPU is used. With default settings this leads to a coarser table.

Change-Id: I35f0c89e00301ac7e1260b1c0dcc1604300da5aa

8 years agoAvoid GPU selection with GPU emulation
Berk Hess [Sun, 21 Jun 2015 06:17:21 +0000 (08:17 +0200)]
Avoid GPU selection with GPU emulation

Change-Id: Iee5949fa11419b0c1344edb6c85ab475baa77719

8 years agoMinor reformatting of SIMD mismatch message
Berk Hess [Mon, 22 Jun 2015 07:33:29 +0000 (09:33 +0200)]
Minor reformatting of SIMD mismatch message

Added extra newline, removed parentheses.

Change-Id: I2ec3f6d078dfa3b4587213c5ec421d36443a01af

8 years agoAdd sugar to print empty line in printBinaryInformation
Berk Hess [Mon, 22 Jun 2015 12:03:39 +0000 (14:03 +0200)]
Add sugar to print empty line in printBinaryInformation

The binary information print was missing a prefix and suffix
on an empty line which caused invalid xvg file formatting.

Change-Id: I8faa76502fc44ebd698387e4ab0f85f1473be710

8 years agoUpdated physical constants from NIST 2010 CODATA
Erik Lindahl [Thu, 18 Jun 2015 16:44:33 +0000 (18:44 +0200)]
Updated physical constants from NIST 2010 CODATA

Minor fixes (usually to the 5-6th decimal), and
more constants have been derived the basic ones instead
of specifying values directly. The units section in
the manual has been updated accordingly.

Fixes #1671.

Change-Id: Ic1d853a4fb6c70c81c3969d3d8ba86f52956ef67

8 years agoRemoved buggy -smooth hack in hbond module
Erik Lindahl [Sun, 21 Jun 2015 13:49:03 +0000 (15:49 +0200)]
Removed buggy -smooth hack in hbond module

As discussed in redmine #1553, this was a hack
added a while ago, but apparently it leads to
segfaults. We should avoid hacks in the first
place, and since nobody has been interested in
fixing it for the last year it's time to kill it.

Fixes #1553.

Change-Id: I94faa3c543bcca4c729753c8b5cdaf5a5775d0ff

8 years agoFix g_energy average/RMSD bug
Berk Hess [Mon, 22 Jun 2015 14:50:53 +0000 (16:50 +0200)]
Fix g_energy average/RMSD bug

Made g_energy produce correct output for energy files from continued
and appended runs with nstcalcenergy=nstenergy. In that case a count
in the energy file is/was incorrect, but that entry is actually not
necessary for determining the average and RMSD of energy terms. The
RMSD would be NaN and the average would be off in the last decimal.

Fixes #1342.

Change-Id: I82007bfe508023e1c1e17366e10f76bc4470d238

8 years agoUpdate launch configuration for physical nodes
Berk Hess [Sun, 21 Jun 2015 09:02:10 +0000 (11:02 +0200)]
Update launch configuration for physical nodes

OpenMP thread count now prints thread count ranges over ranks.
GPU usage report adds host name with multiple MPI processes.

Change-Id: I9011415957ad5d875d2c215abb0f7f60810c372c

8 years agoFix GMX_ALIGNMENT for MSVC 2012 and 2013
Roland Schulz [Fri, 19 Jun 2015 03:37:16 +0000 (23:37 -0400)]
Fix GMX_ALIGNMENT for MSVC 2012 and 2013

Issue previously identified for 2010 is not fixed
until 2015.

Change-Id: I617ac9524a2e054b325fdc19675fdee0a60370c8

8 years agoAvoid fp exceptions in pair search debug
Berk Hess [Thu, 18 Jun 2015 09:42:40 +0000 (11:42 +0200)]
Avoid fp exceptions in pair search debug

Also extended GPU list statistics debug prints.

Change-Id: I8100aac2f3433bf06b3d11c8fedcdd2d3cf5c286

8 years agoFix compiler warnings in cmake tests
Erik Lindahl [Wed, 17 Jun 2015 06:54:20 +0000 (08:54 +0200)]
Fix compiler warnings in cmake tests

This will not be visible to users, and it won't make it
possible to run cmake with -Werror since lots of internal tests
do not work, but since I fixed a couple of them we might
as well put it in gerrit.

Known remaining issues:
- HAVE_LIBM

Refs #1750.

Change-Id: I734f83f229108e50e2914d455f4032137f924773

8 years agoUse MPI_THREAD_FUNNELED when available
Erik Lindahl [Thu, 18 Jun 2015 19:57:11 +0000 (21:57 +0200)]
Use MPI_THREAD_FUNNELED when available

We have never observed any problems with MPI and OpenMP,
but for compliance we should call MPI_Init_thread() and
try to get MPI_THREAD_FUNNELED support level. However,
if that level is not supported we simply call the old
MPI_Init() instead - at least for Gromacs that seems fine.
If we get an error return code we warn the user, but if
MPI_init_thread() still worked we hope for the best and
don't bother the user.

Fixes #1127.

Change-Id: I11b81a65125e32b95255dbb769cf86b835bd62ab

8 years agoFix cmake 3.1 warnings with MSVC
Roland Schulz [Thu, 18 Jun 2015 05:37:23 +0000 (01:37 -0400)]
Fix cmake 3.1 warnings with MSVC

Change-Id: I4c080cd547fdb36695d6d906ea56a1393e4f42aa

8 years agoFix segfault in random access XTC searching
Erik Lindahl [Sat, 20 Jun 2015 09:54:26 +0000 (11:54 +0200)]
Fix segfault in random access XTC searching

The XTC random access routine was accessing natoms
in a substructure that could be a null pointer. Fixed
by adding natoms as a separate field in the
high-level status, so we don't depend on frame data.

Fixes #1705.

Change-Id: I88c961b33ae21b16d64ed5d7514a1e0287c89baf

8 years agoFix argument order error for g_rmsdist
Erik Lindahl [Tue, 16 Jun 2015 22:18:27 +0000 (00:18 +0200)]
Fix argument order error for g_rmsdist

Incorrect argument order to calc_rms() caused
command options to be permuted.

Fixes #1709.

Change-Id: I82042dac463c8bb305ab3d3bc2a122b5409c55ef

8 years agoFix gro errors with PDB insertion codes
Erik Lindahl [Sat, 20 Jun 2015 14:01:46 +0000 (16:01 +0200)]
Fix gro errors with PDB insertion codes

The insertion codes are discarded when converting to GRO files,
which results in adjacent residues with different names but
identical numbers. The reading code has been altered to identify
new residues also when the resname changes; this does not fix
the duplicate numbers (it cannot be fixed in GRO files), but it
will correctly propagate all data so the correct labels can
be recovered by using gmx trjconv with the original PDB file for
the -s argument.

Fixes #1600.

Change-Id: Iaf79f3f9e548e8555d78cb39e869410aa8186029

8 years agoReplaced hardware threads by logical cores in output
Berk Hess [Sun, 21 Jun 2015 06:13:37 +0000 (08:13 +0200)]
Replaced hardware threads by logical cores in output

All output (except for debug output) now uses the term logical cores
to report the number of hardware threads.
Add indentation for per node hardware property prints.

Change-Id: I821c8d76ab498b37aa1b510d8a3dd67bb42ffdf9

8 years agofix CPU core oversubscription detection
Szilard Pall [Sat, 20 Jun 2015 23:04:28 +0000 (01:04 +0200)]
fix CPU core oversubscription detection

The detection became non-functional due to unlucky incorrect order in
which the arguments were passed.

Change-Id: Id29ff87e504585f783be742b92a861c06c5e42ac

8 years agoUpdated docs for g_gyrate
Erik Lindahl [Fri, 19 Jun 2015 08:02:26 +0000 (10:02 +0200)]
Updated docs for g_gyrate

Added the equations we use for the axis
components.

Fixes #1564.

Change-Id: Ifce17326f738a72386bf24f949e418d2550568b5

8 years agoFix potential buffer overflow in pdb2gmx
Erik Lindahl [Thu, 18 Jun 2015 12:44:14 +0000 (14:44 +0200)]
Fix potential buffer overflow in pdb2gmx

Residue rename database entries were read into 6-char
string variables. We now check and issue fatal errors
if the lengths are above 5 characters.

Fixes #1649.

Change-Id: Id4d88a565b212ef279d400f42b5f2732550eded6

8 years agoDisallow infinite epsilon with PME or GB.
Erik Lindahl [Fri, 19 Jun 2015 08:20:23 +0000 (10:20 +0200)]
Disallow infinite epsilon with PME or GB.

This leads to divide-by-zero errors, and since it just turns off
electrostatics it will be faster to use a plain cutoff, which we
now recommend instead.

Fixes #1297.

Change-Id: Ia5eba7a1d4bd3b387174c9cb4878a2d65ead2c6c

8 years agoRemove GMX_MAX_MPI_THREADS
Erik Lindahl [Fri, 19 Jun 2015 07:29:40 +0000 (09:29 +0200)]
Remove GMX_MAX_MPI_THREADS

This variable has been orpaned for quite a while, and
it's a good example how we introduce bugs by introducing
lots of ways to control the same functionality, and then
we forget to update some of them later. Let's focus on
the command line options as the single way to control
the number of threads in Gromacs.

Fixes #1550.

Change-Id: I37a87125b9dcac36362b561418d787167bb64cec

8 years agoFix reproducibility bug in fft5d
Erik Lindahl [Fri, 19 Jun 2015 10:16:23 +0000 (12:16 +0200)]
Fix reproducibility bug in fft5d

fft5d has been accessing FFTW directly instead of using the
Gromacs FFT interface, and while doing so the estimate flag was
not correctly set for reproducible runs. For now we have just
fixed it, but this FFTW-specific code should be removed from fft5d,
or we will likely see more fft bugs due to duplicated code paths.

Fixes #1690.

Change-Id: Ib03f7af710ed208d2824f105bd15712d32632cfa

8 years agoHandle multidir/multisim with single argument correctly
Erik Lindahl [Thu, 18 Jun 2015 17:26:27 +0000 (19:26 +0200)]
Handle multidir/multisim with single argument correctly

Mdrun would only initialize the multi option correctly
with more than one argument, which caused mdrun to fail
in strange ways since it looked for topol.tpr in the
current directory instead.

Fixes #1712.

Change-Id: Ib89860fdff5f8523eee6c2f5a068390b8d4e3c8d

8 years agoFix incorrect shift with g_density -center
Erik Lindahl [Tue, 16 Jun 2015 22:15:18 +0000 (00:15 +0200)]
Fix incorrect shift with g_density -center

Fixes #1698.

Change-Id: I22be246eded9c1fc6f421f14eb3938584afed0de

8 years agoFix missing include
Roland Schulz [Thu, 18 Jun 2015 05:58:23 +0000 (01:58 -0400)]
Fix missing include

Didn't compile with MSVC 2013

Change-Id: Ice8af840ba52dc7b6c9fe54c269a641f0ccc3c60

8 years agoReduced the cost of the pull communication
Berk Hess [Mon, 11 Aug 2014 16:11:17 +0000 (18:11 +0200)]
Reduced the cost of the pull communication

With more than 32 ranks, a sub-communicator will be used
for the pull communication. This reduces the pull communication
significantly with small pull groups. With large pull groups the total
simulation performance might not improve much, because ranks
that are not in the sub-communicator will later wait for the pull
ranks during the communication for the constraints.

Added a pull_comm_t struct to separate the data used for communication.

Change-Id: I92b64d098b508b11718ef3ae175b771032ad7be2

8 years agoFix typo in GMX_BUILD_OWN_FFTW message
Mark Abraham [Wed, 17 Jun 2015 21:16:04 +0000 (23:16 +0200)]
Fix typo in GMX_BUILD_OWN_FFTW message

Change-Id: Ieec8b7d1bccd7e9654a14091e42f5047d441db31

8 years agofix minor CUDA NB kernel performance regression
Szilard Pall [Wed, 17 Jun 2015 22:59:57 +0000 (00:59 +0200)]
fix minor CUDA NB kernel performance regression

Commit f2b9db26 introduced the thread index z component as a stride in
the middle j4 loop. As this index is not a constant but a value
loaded from a special register, this change caused up to a few %
performance loss in the force kernels. This went unnoticed because
some architectures (cc 3.5/5.2) and some compilers (CUDA 7.0) were
barely affected.

Change-Id: I423790e8fb01a35f7234d26ff064dcc555e73c48

8 years agoMinor clean up for refdata.*
Teemu Murtola [Wed, 17 Jun 2015 10:53:54 +0000 (13:53 +0300)]
Minor clean up for refdata.*

- Remove global functions that are no longer necessary.  All the state
  about the reference data mode is stored internally in refdata.cpp.
  These were remnants from an old implementation where the code was
  split into multiple .cpp files to support compilation of testutils/
  without libxml2 dependencies.
- Make the self-tests for the reference data code not use the source
  tree as a location for the transient data they create.

In addition to clarifying the code, these should make it harder to
misuse the constructor intended for self-testing, since it will be
difficult to pass Jenkins if someone tries to use it for other tests.

Change-Id: I204ddadfc224a79c587f0588a4d510b7b8486f9b