Add SYCL implementation of LINCS
[alexxy/gromacs.git] / src / gromacs / mdlib / lincs_gpu_internal.cu
index c19b1831f105f0bc29f5ddb3eccd51e2d38c87cd..8f854f604a23365046a92aeb9cde9afe99dadcca 100644 (file)
@@ -64,7 +64,7 @@ constexpr static int c_maxThreadsPerBlock = c_threadsPerBlock;
  *
  * See Hess et al., J. Comput. Chem. 18: 1463-1472 (1997) for the description of the algorithm.
  *
- * In CUDA version, one thread is responsible for all computations for one constraint. The blocks are
+ * In GPU version, one thread is responsible for all computations for one constraint. The blocks are
  * filled in a way that no constraint is coupled to the constraint from the next block. This is achieved
  * by moving active threads to the next block, if the correspondent group of coupled constraints is to big
  * to fit the current thread block. This may leave some 'dummy' threads in the end of the thread block, i.e.
@@ -407,14 +407,14 @@ inline auto getLincsKernelPtr(const bool updateVelocities, const bool computeVir
     return kernelPtr;
 }
 
-void launchLincsGpuKernel(const LincsGpuKernelParameters& kernelParams,
-                          const DeviceBuffer<Float3>&     d_x,
-                          DeviceBuffer<Float3>            d_xp,
-                          const bool                      updateVelocities,
-                          DeviceBuffer<Float3>            d_v,
-                          const real                      invdt,
-                          const bool                      computeVirial,
-                          const DeviceStream&             deviceStream)
+void launchLincsGpuKernel(LincsGpuKernelParameters&   kernelParams,
+                          const DeviceBuffer<Float3>& d_x,
+                          DeviceBuffer<Float3>        d_xp,
+                          const bool                  updateVelocities,
+                          DeviceBuffer<Float3>        d_v,
+                          const real                  invdt,
+                          const bool                  computeVirial,
+                          const DeviceStream&         deviceStream)
 {
 
     auto kernelPtr = getLincsKernelPtr(updateVelocities, computeVirial);