Fix DD load balancing bug with GPU sharing

author Szilárd Páll <pall.szilard@gmail.com>

Tue, 19 Nov 2013 02:00:24 +0000 (03:00 +0100)

committer Gerrit Code Review <gerrit@gerrit.gromacs.org>

Tue, 19 Nov 2013 15:18:03 +0000 (16:18 +0100)
author Szilárd Páll <pall.szilard@gmail.com>
Tue, 19 Nov 2013 02:00:24 +0000 (03:00 +0100)
committer Gerrit Code Review <gerrit@gerrit.gromacs.org>
Tue, 19 Nov 2013 15:18:03 +0000 (16:18 +0100)
diff --git a/src/gmxlib/gpu_utils/gpu_utils.cu b/src/gmxlib/gpu_utils/gpu_utils.cu

index ee3d5e10d6a99e6d9fa700edc67cd0ac8d05b030..24fc7557a6a261c52c415fbd1d5e0e63bf2474ad 100644 (file)
--- a/src/gmxlib/gpu_utils/gpu_utils.cu
+++ b/src/gmxlib/gpu_utils/gpu_utils.cu
@@ -860,10 +860,7 @@ int get_gpu_device_id(const gmx_gpu_info_t *gpu_info,
  {
      assert(gpu_info);
      assert(gpu_opt);
-    if (idx < 0 && idx >= gpu_opt->ncuda_dev_use)
-    {
-        return -1;
-    }
+    assert(idx >= 0 && idx < gpu_opt->ncuda_dev_use);
  
      return gpu_info->cuda_dev[gpu_opt->cuda_dev_use[idx]].id;
  }
diff --git a/src/kernel/runner.c b/src/kernel/runner.c

index 17b5f351ad044b5756ad317285078c0d1c55671c..68ea884a0b603c2d0a3bfbff6fd7442ac37b51b6 100644 (file)
--- a/src/kernel/runner.c
+++ b/src/kernel/runner.c
@@ -1481,6 +1481,11 @@ int mdrunner(gmx_hw_opt_t *hw_opt,
          gmx_select_gpu_ids(fplog, cr, &hwinfo->gpu_info, bForceUseGPU,
                             &hw_opt->gpu_opt);
      }
+    else
+    {
+        /* Ignore (potentially) manually selected GPUs */
+        hw_opt->gpu_opt.ncuda_dev_use = 0;
+    }
  
      /* check consistency of CPU acceleration and number of GPUs selected */
      gmx_check_hw_runconf_consistency(fplog, hwinfo, cr, hw_opt, bUseGPU);
diff --git a/src/mdlib/domdec.c b/src/mdlib/domdec.c

index d488b0bdf16840133bdf9ddecf4d28a6a9352969..92fa8c16406004ebb400b01a8d846e7590d449ff 100644 (file)
--- a/src/mdlib/domdec.c
+++ b/src/mdlib/domdec.c
@@ -5697,7 +5697,7 @@ void dd_setup_dlb_resource_sharing(t_commrec *cr,
  
      physicalnode_id_hash = gmx_physicalnode_id_hash();
  
-    gpu_id = get_gpu_device_id(&hwinfo->gpu_info, &hw_opt->gpu_opt, cr->nodeid);
+    gpu_id = get_gpu_device_id(&hwinfo->gpu_info, &hw_opt->gpu_opt, cr->rank_pp_intranode);
  
      dd = cr->dd;
author	Szilárd Páll <pall.szilard@gmail.com>
	Tue, 19 Nov 2013 02:00:24 +0000 (03:00 +0100)
committer	Gerrit Code Review <gerrit@gerrit.gromacs.org>
	Tue, 19 Nov 2013 15:18:03 +0000 (16:18 +0100)
src/gmxlib/gpu_utils/gpu_utils.cu		patch \| blob \| history
src/kernel/runner.c		patch \| blob \| history
src/mdlib/domdec.c		patch \| blob \| history