Fix the GPU bonded stream with 1 PP + 1 PME rank
authorSzilárd Páll <pall.szilard@gmail.com>
Sat, 14 Dec 2019 22:15:44 +0000 (23:15 +0100)
committerMark Abraham <mark.j.abraham@gmail.com>
Mon, 16 Dec 2019 16:56:20 +0000 (17:56 +0100)
commite8ea448085d91a26b82da0eada215306c35e7e9e
tree61a2a633cca9a617fd9c50b3fce6028d99c0a3fb
parent63a8c47536dbb0867309e527b72f6935449a51be
Fix the GPU bonded stream with 1 PP + 1 PME rank

WIth 1 PP + 1 PME rank the GpuBonded constructor gets passed the
non-local nonbonded stream which is nullptr and as a result the bonded
kernel launch happens in the default stream blocking concurrent
kernel execution.
This change makes sure that only when there is PP domain decomposition
is the GpuBonded constructor passed the nonlocal stream.

Fixes #3241

Change-Id: I858401b78c620adc3bea176e40e6fa179e583483
docs/release-notes/2019/2019.5.rst
src/gromacs/mdlib/forcerec.cpp