Merge release-5-0 into master
[alexxy/gromacs.git] / src / gromacs / gmxlib / cuda_tools / pmalloc_cuda.cu
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 2012,2014, by the GROMACS development team, led by
5  * Mark Abraham, David van der Spoel, Berk Hess, and Erik Lindahl,
6  * and including many others, as listed in the AUTHORS file in the
7  * top-level source directory and at http://www.gromacs.org.
8  *
9  * GROMACS is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public License
11  * as published by the Free Software Foundation; either version 2.1
12  * of the License, or (at your option) any later version.
13  *
14  * GROMACS is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with GROMACS; if not, see
21  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
22  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
23  *
24  * If you want to redistribute modifications to GROMACS, please
25  * consider that scientific software is very special. Version
26  * control is crucial - bugs must be traceable. We will be happy to
27  * consider code for inclusion in the official distribution, but
28  * derived work must not be called official GROMACS. Details are found
29  * in the README & COPYING files - if they are missing, get the
30  * official version at http://www.gromacs.org.
31  *
32  * To help us fund GROMACS development, we humbly ask that you cite
33  * the research papers on the package. Check out http://www.gromacs.org.
34  */
35
36 #include <stdlib.h>
37
38 #include "cudautils.cuh"
39 #include "pmalloc_cuda.h"
40
41 #include "gromacs/utility/cstringutil.h"
42
43 /*! Allocates nbytes of page-locked memory.
44  *  This memory should always be freed using pfree (or with the page-locked
45  *  free functions provied by the CUDA library).
46  */
47 void pmalloc(void **h_ptr, size_t nbytes)
48 {
49     cudaError_t stat;
50     char        strbuf[STRLEN];
51     int         flag = cudaHostAllocDefault;
52
53     if (nbytes == 0)
54     {
55         *h_ptr = NULL;
56         return;
57     }
58
59     CU_CHECK_PREV_ERR();
60
61     stat = cudaMallocHost(h_ptr, nbytes, flag);
62     sprintf(strbuf, "cudaMallocHost of size %d bytes failed", (int)nbytes);
63     CU_RET_ERR(stat, strbuf);
64 }
65
66 /*! Allocates nbytes of page-locked memory with write-combining.
67  *  This memory should always be freed using pfree (or with the page-locked
68  *  free functions provied by the CUDA library).
69  */
70 void pmalloc_wc(void **h_ptr, size_t nbytes)
71 {
72     cudaError_t stat;
73     char        strbuf[STRLEN];
74     int         flag = cudaHostAllocDefault || cudaHostAllocWriteCombined;
75
76     if (nbytes == 0)
77     {
78         *h_ptr = NULL;
79         return;
80     }
81
82     CU_CHECK_PREV_ERR();
83
84     stat = cudaMallocHost(h_ptr, nbytes, flag);
85     sprintf(strbuf, "cudaMallocHost of size %d bytes failed", (int)nbytes);
86     CU_RET_ERR(stat, strbuf);
87 }
88
89 /*! Frees page locked memory allocated with pmalloc.
90  *  This function can safely be called also with a pointer to a page-locked
91  *  memory allocated directly with CUDA API calls.
92  */
93 void pfree(void *h_ptr)
94 {
95     cudaError_t stat;
96
97     if (h_ptr == NULL)
98     {
99         return;
100     }
101
102     CU_CHECK_PREV_ERR();
103
104     stat = cudaFreeHost(h_ptr);
105     CU_RET_ERR(stat, "cudaFreeHost failed");
106 }