fe663451426ace46583787c3cd3a51085d6efedf
[alexxy/gromacs.git] / src / gmxlib / gmx_lapack / sormqr.c
1 /*
2  * This file is part of the GROMACS molecular simulation package.
3  *
4  * Copyright (c) 2012, by the GROMACS development team, led by
5  * David van der Spoel, Berk Hess, Erik Lindahl, and including many
6  * others, as listed in the AUTHORS file in the top-level source
7  * directory and at http://www.gromacs.org.
8  *
9  * GROMACS is free software; you can redistribute it and/or
10  * modify it under the terms of the GNU Lesser General Public License
11  * as published by the Free Software Foundation; either version 2.1
12  * of the License, or (at your option) any later version.
13  *
14  * GROMACS is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
17  * Lesser General Public License for more details.
18  *
19  * You should have received a copy of the GNU Lesser General Public
20  * License along with GROMACS; if not, see
21  * http://www.gnu.org/licenses, or write to the Free Software Foundation,
22  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA.
23  *
24  * If you want to redistribute modifications to GROMACS, please
25  * consider that scientific software is very special. Version
26  * control is crucial - bugs must be traceable. We will be happy to
27  * consider code for inclusion in the official distribution, but
28  * derived work must not be called official GROMACS. Details are found
29  * in the README & COPYING files - if they are missing, get the
30  * official version at http://www.gromacs.org.
31  *
32  * To help us fund GROMACS development, we humbly ask that you cite
33  * the research papers on the package. Check out http://www.gromacs.org.
34  */
35 #include "gmx_lapack.h"
36 #include "lapack_limits.h"
37
38 void 
39 F77_FUNC(sormqr,SORMQR)(const char *side, 
40         const char *trans, 
41         int *m, 
42         int *n, 
43         int *k, 
44         float *a, 
45         int *lda, 
46         float *tau, 
47         float *c__, 
48         int *ldc, 
49         float *work, 
50         int *lwork, 
51         int *info)
52 {
53    int a_dim1, a_offset, c_dim1, c_offset, i__1, i__2, i__4, i__5;
54
55     int i__;
56     float t[4160];
57     int i1, i2, i3, ib, ic, jc, nb, mi, ni, nq, nw, iws;
58     int left;
59     int nbmin, iinfo;
60     int notran;
61     int ldwork, lwkopt;
62     int lquery;
63     int ldt = 65;
64
65     a_dim1 = *lda;
66     a_offset = 1 + a_dim1;
67     a -= a_offset;
68     --tau;
69     c_dim1 = *ldc;
70     c_offset = 1 + c_dim1;
71     c__ -= c_offset;
72     --work;
73
74     *info = 0;
75     left = (*side=='L' || *side=='l');
76     notran = (*trans=='N' || *trans=='n');
77     lquery = *lwork == -1;
78
79     if (left) {
80         nq = *m;
81         nw = *n;
82     } else {
83         nq = *n;
84         nw = *m;
85     }
86
87      ic = jc = 0;
88      nb = DORMQR_BLOCKSIZE;
89      lwkopt = nw * nb;
90      work[1] = (float) lwkopt;
91
92     if (*info != 0) {
93         i__1 = -(*info);
94         return;
95     } else if (lquery) {
96       return;
97     }
98
99     if (*m == 0 || *n == 0 || *k == 0) {
100         work[1] = 1.;
101         return;
102     }
103
104     nbmin = 2;
105     ldwork = nw;
106     if (nb > 1 && nb < *k) {
107         iws = nw * nb;
108         if (*lwork < iws) {
109             nb = *lwork / ldwork;
110             nbmin = DORMQR_MINBLOCKSIZE;
111         }
112     } else {
113         iws = nw;
114     }
115
116     if (nb < nbmin || nb >= *k) {
117
118         F77_FUNC(sorm2r,SORM2R)(side, trans, m, n, k, &a[a_offset], lda, &tau[1], &c__[
119                 c_offset], ldc, &work[1], &iinfo);
120     } else {
121
122         if ((left && !notran) || (!left && notran)) {
123             i1 = 1;
124             i2 = *k;
125             i3 = nb;
126         } else {
127             i1 = (*k - 1) / nb * nb + 1;
128             i2 = 1;
129             i3 = -nb;
130         }
131
132         if (left) {
133             ni = *n;
134             jc = 1;
135         } else {
136             mi = *m;
137             ic = 1;
138         }
139
140         i__1 = i2;
141         i__2 = i3;
142         for (i__ = i1; i__2 < 0 ? i__ >= i__1 : i__ <= i__1; i__ += i__2) {
143             i__4 = nb, i__5 = *k - i__ + 1;
144             ib = (i__4<i__5) ? i__4 : i__5;
145
146             i__4 = nq - i__ + 1;
147             F77_FUNC(slarft,SLARFT)("Forward", "Columnwise", &i__4, &ib, &a[i__ + i__ * 
148                     a_dim1], lda, &tau[i__], t, &ldt);
149             if (left) {
150
151                 mi = *m - i__ + 1;
152                 ic = i__;
153             } else {
154                 ni = *n - i__ + 1;
155                 jc = i__;
156             }
157
158             F77_FUNC(slarfb,SLARFB)(side, trans, "Forward", "Columnwise", &mi, &ni, &ib, &a[
159                     i__ + i__ * a_dim1], lda, t, &ldt, &c__[ic + jc * 
160                     c_dim1], ldc, &work[1], &ldwork);
161         }
162     }
163     work[1] = (float) lwkopt;
164     return;
165
166
167 }
168
169