Merge branch release-4-6 into release-5-0
[alexxy/gromacs.git] / src / gromacs / gmxlib / cuda_tools / pmalloc_cuda.cu
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 2012,2014, by the GROMACS development team, led by
5  * Mark Abraham, David van der Spoel, Berk Hess, and Erik Lindahl,
6  * and including many others, as listed in the AUTHORS file in the
7  * top-level source directory and at http://www.gromacs.org.
8  *
9  * GROMACS is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public License
11  * as published by the Free Software Foundation; either version 2.1
12  * of the License, or (at your option) any later version.
13  *
14  * GROMACS is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with GROMACS; if not, see
21  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
22  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
23  *
24  * If you want to redistribute modifications to GROMACS, please
25  * consider that scientific software is very special. Version
26  * control is crucial - bugs must be traceable. We will be happy to
27  * consider code for inclusion in the official distribution, but
28  * derived work must not be called official GROMACS. Details are found
29  * in the README & COPYING files - if they are missing, get the
30  * official version at http://www.gromacs.org.
31  *
32  * To help us fund GROMACS development, we humbly ask that you cite
33  * the research papers on the package. Check out http://www.gromacs.org.
34  */
35
36 #include <stdlib.h>
37
38 #include "cudautils.cuh"
39 #include "pmalloc_cuda.h"
40
41 /*! Allocates nbytes of page-locked memory.
42  *  This memory should always be freed using pfree (or with the page-locked
43  *  free functions provied by the CUDA library).
44  */
45 void pmalloc(void **h_ptr, size_t nbytes)
46 {
47     cudaError_t stat;
48     char        strbuf[STRLEN];
49     int         flag = cudaHostAllocDefault;
50
51     if (nbytes == 0)
52     {
53         *h_ptr = NULL;
54         return;
55     }
56
57     CU_CHECK_PREV_ERR();
58
59     stat = cudaMallocHost(h_ptr, nbytes, flag);
60     sprintf(strbuf, "cudaMallocHost of size %d bytes failed", (int)nbytes);
61     CU_RET_ERR(stat, strbuf);
62 }
63
64 /*! Allocates nbytes of page-locked memory with write-combining.
65  *  This memory should always be freed using pfree (or with the page-locked
66  *  free functions provied by the CUDA library).
67  */
68 void pmalloc_wc(void **h_ptr, size_t nbytes)
69 {
70     cudaError_t stat;
71     char        strbuf[STRLEN];
72     int         flag = cudaHostAllocDefault || cudaHostAllocWriteCombined;
73
74     if (nbytes == 0)
75     {
76         *h_ptr = NULL;
77         return;
78     }
79
80     CU_CHECK_PREV_ERR();
81
82     stat = cudaMallocHost(h_ptr, nbytes, flag);
83     sprintf(strbuf, "cudaMallocHost of size %d bytes failed", (int)nbytes);
84     CU_RET_ERR(stat, strbuf);
85 }
86
87 /*! Frees page locked memory allocated with pmalloc.
88  *  This function can safely be called also with a pointer to a page-locked
89  *  memory allocated directly with CUDA API calls.
90  */
91 void pfree(void *h_ptr)
92 {
93     cudaError_t stat;
94
95     if (h_ptr == NULL)
96     {
97         return;
98     }
99
100     CU_CHECK_PREV_ERR();
101
102     stat = cudaFreeHost(h_ptr);
103     CU_RET_ERR(stat, "cudaFreeHost failed");
104 }