Camera tracking: libmv distortion API now also uses camera intrinsics
[blender.git] / source / blender / blenlib / intern / math_matrix.c
1 /*
2  * ***** BEGIN GPL LICENSE BLOCK *****
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public License
6  * as published by the Free Software Foundation; either version 2
7  * of the License, or (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software Foundation,
16  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
17  *
18  * The Original Code is Copyright (C) 2001-2002 by NaN Holding BV.
19  * All rights reserved.
20  *
21  * The Original Code is: some of this file.
22  *
23  * ***** END GPL LICENSE BLOCK *****
24  */
25
26 /** \file blender/blenlib/intern/math_matrix.c
27  *  \ingroup bli
28  */
29
30
31 #include <assert.h>
32 #include "BLI_math.h"
33
34 /********************************* Init **************************************/
35
36 void zero_m3(float m[3][3])
37 {
38         memset(m, 0, 3 * 3 * sizeof(float));
39 }
40
41 void zero_m4(float m[4][4])
42 {
43         memset(m, 0, 4 * 4 * sizeof(float));
44 }
45
46 void unit_m3(float m[3][3])
47 {
48         m[0][0] = m[1][1] = m[2][2] = 1.0;
49         m[0][1] = m[0][2] = 0.0;
50         m[1][0] = m[1][2] = 0.0;
51         m[2][0] = m[2][1] = 0.0;
52 }
53
54 void unit_m4(float m[4][4])
55 {
56         m[0][0] = m[1][1] = m[2][2] = m[3][3] = 1.0;
57         m[0][1] = m[0][2] = m[0][3] = 0.0;
58         m[1][0] = m[1][2] = m[1][3] = 0.0;
59         m[2][0] = m[2][1] = m[2][3] = 0.0;
60         m[3][0] = m[3][1] = m[3][2] = 0.0;
61 }
62
63 void copy_m3_m3(float m1[3][3], float m2[3][3])
64 {
65         /* destination comes first: */
66         memcpy(&m1[0], &m2[0], 9 * sizeof(float));
67 }
68
69 void copy_m4_m4(float m1[4][4], float m2[4][4])
70 {
71         memcpy(m1, m2, 4 * 4 * sizeof(float));
72 }
73
74 void copy_m3_m4(float m1[3][3], float m2[4][4])
75 {
76         m1[0][0] = m2[0][0];
77         m1[0][1] = m2[0][1];
78         m1[0][2] = m2[0][2];
79
80         m1[1][0] = m2[1][0];
81         m1[1][1] = m2[1][1];
82         m1[1][2] = m2[1][2];
83
84         m1[2][0] = m2[2][0];
85         m1[2][1] = m2[2][1];
86         m1[2][2] = m2[2][2];
87 }
88
89 void copy_m4_m3(float m1[4][4], float m2[3][3]) /* no clear */
90 {
91         m1[0][0] = m2[0][0];
92         m1[0][1] = m2[0][1];
93         m1[0][2] = m2[0][2];
94
95         m1[1][0] = m2[1][0];
96         m1[1][1] = m2[1][1];
97         m1[1][2] = m2[1][2];
98
99         m1[2][0] = m2[2][0];
100         m1[2][1] = m2[2][1];
101         m1[2][2] = m2[2][2];
102
103         /*      Reevan's Bugfix */
104         m1[0][3] = 0.0F;
105         m1[1][3] = 0.0F;
106         m1[2][3] = 0.0F;
107
108         m1[3][0] = 0.0F;
109         m1[3][1] = 0.0F;
110         m1[3][2] = 0.0F;
111         m1[3][3] = 1.0F;
112
113 }
114
115 void swap_m3m3(float m1[3][3], float m2[3][3])
116 {
117         float t;
118         int i, j;
119
120         for (i = 0; i < 3; i++) {
121                 for (j = 0; j < 3; j++) {
122                         t = m1[i][j];
123                         m1[i][j] = m2[i][j];
124                         m2[i][j] = t;
125                 }
126         }
127 }
128
129 void swap_m4m4(float m1[4][4], float m2[4][4])
130 {
131         float t;
132         int i, j;
133
134         for (i = 0; i < 4; i++) {
135                 for (j = 0; j < 4; j++) {
136                         t = m1[i][j];
137                         m1[i][j] = m2[i][j];
138                         m2[i][j] = t;
139                 }
140         }
141 }
142
143 /******************************** Arithmetic *********************************/
144
145 void mult_m4_m4m4(float m1[4][4], float m3_[4][4], float m2_[4][4])
146 {
147         float m2[4][4], m3[4][4];
148
149         /* copy so it works when m1 is the same pointer as m2 or m3 */
150         copy_m4_m4(m2, m2_);
151         copy_m4_m4(m3, m3_);
152
153         /* matrix product: m1[j][k] = m2[j][i].m3[i][k] */
154         m1[0][0] = m2[0][0] * m3[0][0] + m2[0][1] * m3[1][0] + m2[0][2] * m3[2][0] + m2[0][3] * m3[3][0];
155         m1[0][1] = m2[0][0] * m3[0][1] + m2[0][1] * m3[1][1] + m2[0][2] * m3[2][1] + m2[0][3] * m3[3][1];
156         m1[0][2] = m2[0][0] * m3[0][2] + m2[0][1] * m3[1][2] + m2[0][2] * m3[2][2] + m2[0][3] * m3[3][2];
157         m1[0][3] = m2[0][0] * m3[0][3] + m2[0][1] * m3[1][3] + m2[0][2] * m3[2][3] + m2[0][3] * m3[3][3];
158
159         m1[1][0] = m2[1][0] * m3[0][0] + m2[1][1] * m3[1][0] + m2[1][2] * m3[2][0] + m2[1][3] * m3[3][0];
160         m1[1][1] = m2[1][0] * m3[0][1] + m2[1][1] * m3[1][1] + m2[1][2] * m3[2][1] + m2[1][3] * m3[3][1];
161         m1[1][2] = m2[1][0] * m3[0][2] + m2[1][1] * m3[1][2] + m2[1][2] * m3[2][2] + m2[1][3] * m3[3][2];
162         m1[1][3] = m2[1][0] * m3[0][3] + m2[1][1] * m3[1][3] + m2[1][2] * m3[2][3] + m2[1][3] * m3[3][3];
163
164         m1[2][0] = m2[2][0] * m3[0][0] + m2[2][1] * m3[1][0] + m2[2][2] * m3[2][0] + m2[2][3] * m3[3][0];
165         m1[2][1] = m2[2][0] * m3[0][1] + m2[2][1] * m3[1][1] + m2[2][2] * m3[2][1] + m2[2][3] * m3[3][1];
166         m1[2][2] = m2[2][0] * m3[0][2] + m2[2][1] * m3[1][2] + m2[2][2] * m3[2][2] + m2[2][3] * m3[3][2];
167         m1[2][3] = m2[2][0] * m3[0][3] + m2[2][1] * m3[1][3] + m2[2][2] * m3[2][3] + m2[2][3] * m3[3][3];
168
169         m1[3][0] = m2[3][0] * m3[0][0] + m2[3][1] * m3[1][0] + m2[3][2] * m3[2][0] + m2[3][3] * m3[3][0];
170         m1[3][1] = m2[3][0] * m3[0][1] + m2[3][1] * m3[1][1] + m2[3][2] * m3[2][1] + m2[3][3] * m3[3][1];
171         m1[3][2] = m2[3][0] * m3[0][2] + m2[3][1] * m3[1][2] + m2[3][2] * m3[2][2] + m2[3][3] * m3[3][2];
172         m1[3][3] = m2[3][0] * m3[0][3] + m2[3][1] * m3[1][3] + m2[3][2] * m3[2][3] + m2[3][3] * m3[3][3];
173
174 }
175
176 void mul_m3_m3m3(float m1[3][3], float m3_[3][3], float m2_[3][3])
177 {
178         float m2[3][3], m3[3][3];
179
180         /* copy so it works when m1 is the same pointer as m2 or m3 */
181         copy_m3_m3(m2, m2_);
182         copy_m3_m3(m3, m3_);
183
184         /* m1[i][j] = m2[i][k] * m3[k][j], args are flipped!  */
185         m1[0][0] = m2[0][0] * m3[0][0] + m2[0][1] * m3[1][0] + m2[0][2] * m3[2][0];
186         m1[0][1] = m2[0][0] * m3[0][1] + m2[0][1] * m3[1][1] + m2[0][2] * m3[2][1];
187         m1[0][2] = m2[0][0] * m3[0][2] + m2[0][1] * m3[1][2] + m2[0][2] * m3[2][2];
188
189         m1[1][0] = m2[1][0] * m3[0][0] + m2[1][1] * m3[1][0] + m2[1][2] * m3[2][0];
190         m1[1][1] = m2[1][0] * m3[0][1] + m2[1][1] * m3[1][1] + m2[1][2] * m3[2][1];
191         m1[1][2] = m2[1][0] * m3[0][2] + m2[1][1] * m3[1][2] + m2[1][2] * m3[2][2];
192
193         m1[2][0] = m2[2][0] * m3[0][0] + m2[2][1] * m3[1][0] + m2[2][2] * m3[2][0];
194         m1[2][1] = m2[2][0] * m3[0][1] + m2[2][1] * m3[1][1] + m2[2][2] * m3[2][1];
195         m1[2][2] = m2[2][0] * m3[0][2] + m2[2][1] * m3[1][2] + m2[2][2] * m3[2][2];
196 }
197
198 void mul_m4_m4m3(float m1[4][4], float m3_[4][4], float m2_[3][3])
199 {
200         float m2[3][3], m3[4][4];
201
202         /* copy so it works when m1 is the same pointer as m2 or m3 */
203         copy_m3_m3(m2, m2_);
204         copy_m4_m4(m3, m3_);
205
206         m1[0][0] = m2[0][0] * m3[0][0] + m2[0][1] * m3[1][0] + m2[0][2] * m3[2][0];
207         m1[0][1] = m2[0][0] * m3[0][1] + m2[0][1] * m3[1][1] + m2[0][2] * m3[2][1];
208         m1[0][2] = m2[0][0] * m3[0][2] + m2[0][1] * m3[1][2] + m2[0][2] * m3[2][2];
209         m1[1][0] = m2[1][0] * m3[0][0] + m2[1][1] * m3[1][0] + m2[1][2] * m3[2][0];
210         m1[1][1] = m2[1][0] * m3[0][1] + m2[1][1] * m3[1][1] + m2[1][2] * m3[2][1];
211         m1[1][2] = m2[1][0] * m3[0][2] + m2[1][1] * m3[1][2] + m2[1][2] * m3[2][2];
212         m1[2][0] = m2[2][0] * m3[0][0] + m2[2][1] * m3[1][0] + m2[2][2] * m3[2][0];
213         m1[2][1] = m2[2][0] * m3[0][1] + m2[2][1] * m3[1][1] + m2[2][2] * m3[2][1];
214         m1[2][2] = m2[2][0] * m3[0][2] + m2[2][1] * m3[1][2] + m2[2][2] * m3[2][2];
215 }
216
217 /* m1 = m2 * m3, ignore the elements on the 4th row/column of m3 */
218 void mult_m3_m3m4(float m1[3][3], float m3_[4][4], float m2_[3][3])
219 {
220         float m2[3][3], m3[4][4];
221
222         /* copy so it works when m1 is the same pointer as m2 or m3 */
223         copy_m3_m3(m2, m2_);
224         copy_m4_m4(m3, m3_);
225
226         /* m1[i][j] = m2[i][k] * m3[k][j] */
227         m1[0][0] = m2[0][0] * m3[0][0] + m2[0][1] * m3[1][0] + m2[0][2] * m3[2][0];
228         m1[0][1] = m2[0][0] * m3[0][1] + m2[0][1] * m3[1][1] + m2[0][2] * m3[2][1];
229         m1[0][2] = m2[0][0] * m3[0][2] + m2[0][1] * m3[1][2] + m2[0][2] * m3[2][2];
230
231         m1[1][0] = m2[1][0] * m3[0][0] + m2[1][1] * m3[1][0] + m2[1][2] * m3[2][0];
232         m1[1][1] = m2[1][0] * m3[0][1] + m2[1][1] * m3[1][1] + m2[1][2] * m3[2][1];
233         m1[1][2] = m2[1][0] * m3[0][2] + m2[1][1] * m3[1][2] + m2[1][2] * m3[2][2];
234
235         m1[2][0] = m2[2][0] * m3[0][0] + m2[2][1] * m3[1][0] + m2[2][2] * m3[2][0];
236         m1[2][1] = m2[2][0] * m3[0][1] + m2[2][1] * m3[1][1] + m2[2][2] * m3[2][1];
237         m1[2][2] = m2[2][0] * m3[0][2] + m2[2][1] * m3[1][2] + m2[2][2] * m3[2][2];
238 }
239
240 void mul_m4_m3m4(float m1[4][4], float m3_[3][3], float m2_[4][4])
241 {
242         float m2[4][4], m3[3][3];
243
244         /* copy so it works when m1 is the same pointer as m2 or m3 */
245         copy_m4_m4(m2, m2_);
246         copy_m3_m3(m3, m3_);
247
248         m1[0][0] = m2[0][0] * m3[0][0] + m2[0][1] * m3[1][0] + m2[0][2] * m3[2][0];
249         m1[0][1] = m2[0][0] * m3[0][1] + m2[0][1] * m3[1][1] + m2[0][2] * m3[2][1];
250         m1[0][2] = m2[0][0] * m3[0][2] + m2[0][1] * m3[1][2] + m2[0][2] * m3[2][2];
251         m1[1][0] = m2[1][0] * m3[0][0] + m2[1][1] * m3[1][0] + m2[1][2] * m3[2][0];
252         m1[1][1] = m2[1][0] * m3[0][1] + m2[1][1] * m3[1][1] + m2[1][2] * m3[2][1];
253         m1[1][2] = m2[1][0] * m3[0][2] + m2[1][1] * m3[1][2] + m2[1][2] * m3[2][2];
254         m1[2][0] = m2[2][0] * m3[0][0] + m2[2][1] * m3[1][0] + m2[2][2] * m3[2][0];
255         m1[2][1] = m2[2][0] * m3[0][1] + m2[2][1] * m3[1][1] + m2[2][2] * m3[2][1];
256         m1[2][2] = m2[2][0] * m3[0][2] + m2[2][1] * m3[1][2] + m2[2][2] * m3[2][2];
257 }
258
259 void mul_serie_m3(float answ[3][3],
260                   float m1[3][3], float m2[3][3], float m3[3][3],
261                   float m4[3][3], float m5[3][3], float m6[3][3],
262                   float m7[3][3], float m8[3][3])
263 {
264         float temp[3][3];
265
266         if (m1 == NULL || m2 == NULL) return;
267
268         mul_m3_m3m3(answ, m2, m1);
269         if (m3) {
270                 mul_m3_m3m3(temp, m3, answ);
271                 if (m4) {
272                         mul_m3_m3m3(answ, m4, temp);
273                         if (m5) {
274                                 mul_m3_m3m3(temp, m5, answ);
275                                 if (m6) {
276                                         mul_m3_m3m3(answ, m6, temp);
277                                         if (m7) {
278                                                 mul_m3_m3m3(temp, m7, answ);
279                                                 if (m8) {
280                                                         mul_m3_m3m3(answ, m8, temp);
281                                                 }
282                                                 else copy_m3_m3(answ, temp);
283                                         }
284                                 }
285                                 else copy_m3_m3(answ, temp);
286                         }
287                 }
288                 else copy_m3_m3(answ, temp);
289         }
290 }
291
292 void mul_serie_m4(float answ[4][4], float m1[4][4],
293                   float m2[4][4], float m3[4][4], float m4[4][4],
294                   float m5[4][4], float m6[4][4], float m7[4][4],
295                   float m8[4][4])
296 {
297         float temp[4][4];
298
299         if (m1 == NULL || m2 == NULL) return;
300
301         mult_m4_m4m4(answ, m1, m2);
302         if (m3) {
303                 mult_m4_m4m4(temp, answ, m3);
304                 if (m4) {
305                         mult_m4_m4m4(answ, temp, m4);
306                         if (m5) {
307                                 mult_m4_m4m4(temp, answ, m5);
308                                 if (m6) {
309                                         mult_m4_m4m4(answ, temp, m6);
310                                         if (m7) {
311                                                 mult_m4_m4m4(temp, answ, m7);
312                                                 if (m8) {
313                                                         mult_m4_m4m4(answ, temp, m8);
314                                                 }
315                                                 else copy_m4_m4(answ, temp);
316                                         }
317                                 }
318                                 else copy_m4_m4(answ, temp);
319                         }
320                 }
321                 else copy_m4_m4(answ, temp);
322         }
323 }
324
325 void mul_m4_v3(float mat[4][4], float vec[3])
326 {
327         float x, y;
328
329         x = vec[0];
330         y = vec[1];
331         vec[0] = x * mat[0][0] + y * mat[1][0] + mat[2][0] * vec[2] + mat[3][0];
332         vec[1] = x * mat[0][1] + y * mat[1][1] + mat[2][1] * vec[2] + mat[3][1];
333         vec[2] = x * mat[0][2] + y * mat[1][2] + mat[2][2] * vec[2] + mat[3][2];
334 }
335
336 void mul_v3_m4v3(float in[3], float mat[4][4], const float vec[3])
337 {
338         float x, y;
339
340         x = vec[0];
341         y = vec[1];
342         in[0] = x * mat[0][0] + y * mat[1][0] + mat[2][0] * vec[2] + mat[3][0];
343         in[1] = x * mat[0][1] + y * mat[1][1] + mat[2][1] * vec[2] + mat[3][1];
344         in[2] = x * mat[0][2] + y * mat[1][2] + mat[2][2] * vec[2] + mat[3][2];
345 }
346
347 void mul_v2_m2v2(float r[2], float mat[2][2], const float vec[2])
348 {
349         float x;
350
351         x = vec[0];
352         r[0] = mat[0][0] * x + mat[1][0] * vec[1];
353         r[1] = mat[0][1] * x + mat[1][1] * vec[1];
354 }
355
356 /* same as mul_m4_v3() but doesnt apply translation component */
357 void mul_mat3_m4_v3(float mat[4][4], float vec[3])
358 {
359         float x, y;
360
361         x = vec[0];
362         y = vec[1];
363         vec[0] = x * mat[0][0] + y * mat[1][0] + mat[2][0] * vec[2];
364         vec[1] = x * mat[0][1] + y * mat[1][1] + mat[2][1] * vec[2];
365         vec[2] = x * mat[0][2] + y * mat[1][2] + mat[2][2] * vec[2];
366 }
367
368 void mul_project_m4_v3(float mat[4][4], float vec[3])
369 {
370         const float w = vec[0] * mat[0][3] + vec[1] * mat[1][3] + vec[2] * mat[2][3] + mat[3][3];
371         mul_m4_v3(mat, vec);
372
373         vec[0] /= w;
374         vec[1] /= w;
375         vec[2] /= w;
376 }
377
378 void mul_v4_m4v4(float r[4], float mat[4][4], const float v[4])
379 {
380         float x, y, z;
381
382         x = v[0];
383         y = v[1];
384         z = v[2];
385
386         r[0] = x * mat[0][0] + y * mat[1][0] + z * mat[2][0] + mat[3][0] * v[3];
387         r[1] = x * mat[0][1] + y * mat[1][1] + z * mat[2][1] + mat[3][1] * v[3];
388         r[2] = x * mat[0][2] + y * mat[1][2] + z * mat[2][2] + mat[3][2] * v[3];
389         r[3] = x * mat[0][3] + y * mat[1][3] + z * mat[2][3] + mat[3][3] * v[3];
390 }
391
392 void mul_m4_v4(float mat[4][4], float r[4])
393 {
394         mul_v4_m4v4(r, mat, r);
395 }
396
397 void mul_v4d_m4v4d(double r[4], float mat[4][4], double v[4])
398 {
399         double x, y, z;
400
401         x = v[0];
402         y = v[1];
403         z = v[2];
404
405         r[0] = x * (double)mat[0][0] + y * (double)mat[1][0] + z * (double)mat[2][0] + (double)mat[3][0] * v[3];
406         r[1] = x * (double)mat[0][1] + y * (double)mat[1][1] + z * (double)mat[2][1] + (double)mat[3][1] * v[3];
407         r[2] = x * (double)mat[0][2] + y * (double)mat[1][2] + z * (double)mat[2][2] + (double)mat[3][2] * v[3];
408         r[3] = x * (double)mat[0][3] + y * (double)mat[1][3] + z * (double)mat[2][3] + (double)mat[3][3] * v[3];
409 }
410
411 void mul_m4_v4d(float mat[4][4], double r[4])
412 {
413         mul_v4d_m4v4d(r, mat, r);
414 }
415
416 void mul_v3_m3v3(float r[3], float M[3][3], const float a[3])
417 {
418         r[0] = M[0][0] * a[0] + M[1][0] * a[1] + M[2][0] * a[2];
419         r[1] = M[0][1] * a[0] + M[1][1] * a[1] + M[2][1] * a[2];
420         r[2] = M[0][2] * a[0] + M[1][2] * a[1] + M[2][2] * a[2];
421 }
422
423 void mul_v2_m3v3(float r[2], float M[3][3], const float a[3])
424 {
425         r[0] = M[0][0] * a[0] + M[1][0] * a[1] + M[2][0] * a[2];
426         r[1] = M[0][1] * a[0] + M[1][1] * a[1] + M[2][1] * a[2];
427 }
428
429 void mul_m3_v3(float M[3][3], float r[3])
430 {
431         float tmp[3];
432
433         mul_v3_m3v3(tmp, M, r);
434         copy_v3_v3(r, tmp);
435 }
436
437 void mul_transposed_m3_v3(float mat[3][3], float vec[3])
438 {
439         float x, y;
440
441         x = vec[0];
442         y = vec[1];
443         vec[0] = x * mat[0][0] + y * mat[0][1] + mat[0][2] * vec[2];
444         vec[1] = x * mat[1][0] + y * mat[1][1] + mat[1][2] * vec[2];
445         vec[2] = x * mat[2][0] + y * mat[2][1] + mat[2][2] * vec[2];
446 }
447
448 void mul_m3_fl(float m[3][3], float f)
449 {
450         int i, j;
451
452         for (i = 0; i < 3; i++)
453                 for (j = 0; j < 3; j++)
454                         m[i][j] *= f;
455 }
456
457 void mul_m4_fl(float m[4][4], float f)
458 {
459         int i, j;
460
461         for (i = 0; i < 4; i++)
462                 for (j = 0; j < 4; j++)
463                         m[i][j] *= f;
464 }
465
466 void mul_mat3_m4_fl(float m[4][4], float f)
467 {
468         int i, j;
469
470         for (i = 0; i < 3; i++)
471                 for (j = 0; j < 3; j++)
472                         m[i][j] *= f;
473 }
474
475 void mul_m3_v3_double(float mat[3][3], double vec[3])
476 {
477         double x, y;
478
479         x = vec[0];
480         y = vec[1];
481         vec[0] = x * (double)mat[0][0] + y * (double)mat[1][0] + (double)mat[2][0] * vec[2];
482         vec[1] = x * (double)mat[0][1] + y * (double)mat[1][1] + (double)mat[2][1] * vec[2];
483         vec[2] = x * (double)mat[0][2] + y * (double)mat[1][2] + (double)mat[2][2] * vec[2];
484 }
485
486 void add_m3_m3m3(float m1[3][3], float m2[3][3], float m3[3][3])
487 {
488         int i, j;
489
490         for (i = 0; i < 3; i++)
491                 for (j = 0; j < 3; j++)
492                         m1[i][j] = m2[i][j] + m3[i][j];
493 }
494
495 void add_m4_m4m4(float m1[4][4], float m2[4][4], float m3[4][4])
496 {
497         int i, j;
498
499         for (i = 0; i < 4; i++)
500                 for (j = 0; j < 4; j++)
501                         m1[i][j] = m2[i][j] + m3[i][j];
502 }
503
504 void sub_m3_m3m3(float m1[3][3], float m2[3][3], float m3[3][3])
505 {
506         int i, j;
507
508         for (i = 0; i < 3; i++)
509                 for (j = 0; j < 3; j++)
510                         m1[i][j] = m2[i][j] - m3[i][j];
511 }
512
513 void sub_m4_m4m4(float m1[4][4], float m2[4][4], float m3[4][4])
514 {
515         int i, j;
516
517         for (i = 0; i < 4; i++)
518                 for (j = 0; j < 4; j++)
519                         m1[i][j] = m2[i][j] - m3[i][j];
520 }
521
522 float determinant_m3_array(float m[3][3])
523 {
524         return (m[0][0] * (m[1][1] * m[2][2] - m[1][2] * m[2][1]) -
525                 m[1][0] * (m[0][1] * m[2][2] - m[0][2] * m[2][1]) +
526                 m[2][0] * (m[0][1] * m[1][2] - m[0][2] * m[1][1]));
527 }
528
529 int invert_m3_ex(float m[3][3], const float epsilon)
530 {
531         float tmp[3][3];
532         int success;
533
534         success = invert_m3_m3_ex(tmp, m, epsilon);
535         copy_m3_m3(m, tmp);
536
537         return success;
538 }
539
540 int invert_m3_m3_ex(float m1[3][3], float m2[3][3], const float epsilon)
541 {
542         float det;
543         int a, b, success;
544
545         BLI_assert(epsilon >= 0.0f);
546
547         /* calc adjoint */
548         adjoint_m3_m3(m1, m2);
549
550         /* then determinant old matrix! */
551         det = determinant_m3_array(m2);
552
553         success = (fabsf(det) > epsilon);
554
555         if (LIKELY(det != 0.0f)) {
556                 det = 1.0f / det;
557                 for (a = 0; a < 3; a++) {
558                         for (b = 0; b < 3; b++) {
559                                 m1[a][b] *= det;
560                         }
561                 }
562         }
563         return success;
564 }
565
566 int invert_m3(float m[3][3])
567 {
568         float tmp[3][3];
569         int success;
570
571         success = invert_m3_m3(tmp, m);
572         copy_m3_m3(m, tmp);
573
574         return success;
575 }
576
577 int invert_m3_m3(float m1[3][3], float m2[3][3])
578 {
579         float det;
580         int a, b, success;
581
582         /* calc adjoint */
583         adjoint_m3_m3(m1, m2);
584
585         /* then determinant old matrix! */
586         det = determinant_m3_array(m2);
587
588         success = (det != 0.0f);
589
590         if (LIKELY(det != 0.0f)) {
591                 det = 1.0f / det;
592                 for (a = 0; a < 3; a++) {
593                         for (b = 0; b < 3; b++) {
594                                 m1[a][b] *= det;
595                         }
596                 }
597         }
598
599         return success;
600 }
601
602 int invert_m4(float m[4][4])
603 {
604         float tmp[4][4];
605         int success;
606
607         success = invert_m4_m4(tmp, m);
608         copy_m4_m4(m, tmp);
609
610         return success;
611 }
612
613 /*
614  * invertmat -
615  *      computes the inverse of mat and puts it in inverse.  Returns
616  *  TRUE on success (i.e. can always find a pivot) and FALSE on failure.
617  *  Uses Gaussian Elimination with partial (maximal column) pivoting.
618  *
619  *                                      Mark Segal - 1992
620  */
621
622 int invert_m4_m4(float inverse[4][4], float mat[4][4])
623 {
624         int i, j, k;
625         double temp;
626         float tempmat[4][4];
627         float max;
628         int maxj;
629
630         BLI_assert(inverse != mat);
631
632         /* Set inverse to identity */
633         for (i = 0; i < 4; i++)
634                 for (j = 0; j < 4; j++)
635                         inverse[i][j] = 0;
636         for (i = 0; i < 4; i++)
637                 inverse[i][i] = 1;
638
639         /* Copy original matrix so we don't mess it up */
640         for (i = 0; i < 4; i++)
641                 for (j = 0; j < 4; j++)
642                         tempmat[i][j] = mat[i][j];
643
644         for (i = 0; i < 4; i++) {
645                 /* Look for row with max pivot */
646                 max = fabs(tempmat[i][i]);
647                 maxj = i;
648                 for (j = i + 1; j < 4; j++) {
649                         if (fabsf(tempmat[j][i]) > max) {
650                                 max = fabs(tempmat[j][i]);
651                                 maxj = j;
652                         }
653                 }
654                 /* Swap rows if necessary */
655                 if (maxj != i) {
656                         for (k = 0; k < 4; k++) {
657                                 SWAP(float, tempmat[i][k], tempmat[maxj][k]);
658                                 SWAP(float, inverse[i][k], inverse[maxj][k]);
659                         }
660                 }
661
662                 temp = tempmat[i][i];
663                 if (temp == 0)
664                         return 0;  /* No non-zero pivot */
665                 for (k = 0; k < 4; k++) {
666                         tempmat[i][k] = (float)((double)tempmat[i][k] / temp);
667                         inverse[i][k] = (float)((double)inverse[i][k] / temp);
668                 }
669                 for (j = 0; j < 4; j++) {
670                         if (j != i) {
671                                 temp = tempmat[j][i];
672                                 for (k = 0; k < 4; k++) {
673                                         tempmat[j][k] -= (float)((double)tempmat[i][k] * temp);
674                                         inverse[j][k] -= (float)((double)inverse[i][k] * temp);
675                                 }
676                         }
677                 }
678         }
679         return 1;
680 }
681
682 /****************************** Linear Algebra *******************************/
683
684 void transpose_m3(float mat[3][3])
685 {
686         float t;
687
688         t = mat[0][1];
689         mat[0][1] = mat[1][0];
690         mat[1][0] = t;
691         t = mat[0][2];
692         mat[0][2] = mat[2][0];
693         mat[2][0] = t;
694         t = mat[1][2];
695         mat[1][2] = mat[2][1];
696         mat[2][1] = t;
697 }
698
699 void transpose_m4(float mat[4][4])
700 {
701         float t;
702
703         t = mat[0][1];
704         mat[0][1] = mat[1][0];
705         mat[1][0] = t;
706         t = mat[0][2];
707         mat[0][2] = mat[2][0];
708         mat[2][0] = t;
709         t = mat[0][3];
710         mat[0][3] = mat[3][0];
711         mat[3][0] = t;
712
713         t = mat[1][2];
714         mat[1][2] = mat[2][1];
715         mat[2][1] = t;
716         t = mat[1][3];
717         mat[1][3] = mat[3][1];
718         mat[3][1] = t;
719
720         t = mat[2][3];
721         mat[2][3] = mat[3][2];
722         mat[3][2] = t;
723 }
724
725 void orthogonalize_m3(float mat[3][3], int axis)
726 {
727         float size[3];
728         mat3_to_size(size, mat);
729         normalize_v3(mat[axis]);
730         switch (axis) {
731                 case 0:
732                         if (dot_v3v3(mat[0], mat[1]) < 1) {
733                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
734                                 normalize_v3(mat[2]);
735                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
736                         }
737                         else if (dot_v3v3(mat[0], mat[2]) < 1) {
738                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
739                                 normalize_v3(mat[1]);
740                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
741                         }
742                         else {
743                                 float vec[3];
744
745                                 vec[0] = mat[0][1];
746                                 vec[1] = mat[0][2];
747                                 vec[2] = mat[0][0];
748
749                                 cross_v3_v3v3(mat[2], mat[0], vec);
750                                 normalize_v3(mat[2]);
751                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
752                         }
753                 case 1:
754                         if (dot_v3v3(mat[1], mat[0]) < 1) {
755                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
756                                 normalize_v3(mat[2]);
757                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
758                         }
759                         else if (dot_v3v3(mat[0], mat[2]) < 1) {
760                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
761                                 normalize_v3(mat[0]);
762                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
763                         }
764                         else {
765                                 float vec[3];
766
767                                 vec[0] = mat[1][1];
768                                 vec[1] = mat[1][2];
769                                 vec[2] = mat[1][0];
770
771                                 cross_v3_v3v3(mat[0], mat[1], vec);
772                                 normalize_v3(mat[0]);
773                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
774                         }
775                 case 2:
776                         if (dot_v3v3(mat[2], mat[0]) < 1) {
777                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
778                                 normalize_v3(mat[1]);
779                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
780                         }
781                         else if (dot_v3v3(mat[2], mat[1]) < 1) {
782                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
783                                 normalize_v3(mat[0]);
784                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
785                         }
786                         else {
787                                 float vec[3];
788
789                                 vec[0] = mat[2][1];
790                                 vec[1] = mat[2][2];
791                                 vec[2] = mat[2][0];
792
793                                 cross_v3_v3v3(mat[0], vec, mat[2]);
794                                 normalize_v3(mat[0]);
795                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
796                         }
797         }
798         mul_v3_fl(mat[0], size[0]);
799         mul_v3_fl(mat[1], size[1]);
800         mul_v3_fl(mat[2], size[2]);
801 }
802
803 void orthogonalize_m4(float mat[4][4], int axis)
804 {
805         float size[3];
806         mat4_to_size(size, mat);
807         normalize_v3(mat[axis]);
808         switch (axis) {
809                 case 0:
810                         if (dot_v3v3(mat[0], mat[1]) < 1) {
811                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
812                                 normalize_v3(mat[2]);
813                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
814                         }
815                         else if (dot_v3v3(mat[0], mat[2]) < 1) {
816                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
817                                 normalize_v3(mat[1]);
818                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
819                         }
820                         else {
821                                 float vec[3];
822
823                                 vec[0] = mat[0][1];
824                                 vec[1] = mat[0][2];
825                                 vec[2] = mat[0][0];
826
827                                 cross_v3_v3v3(mat[2], mat[0], vec);
828                                 normalize_v3(mat[2]);
829                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
830                         }
831                 case 1:
832                         normalize_v3(mat[0]);
833                         if (dot_v3v3(mat[1], mat[0]) < 1) {
834                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
835                                 normalize_v3(mat[2]);
836                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
837                         }
838                         else if (dot_v3v3(mat[0], mat[2]) < 1) {
839                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
840                                 normalize_v3(mat[0]);
841                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
842                         }
843                         else {
844                                 float vec[3];
845
846                                 vec[0] = mat[1][1];
847                                 vec[1] = mat[1][2];
848                                 vec[2] = mat[1][0];
849
850                                 cross_v3_v3v3(mat[0], mat[1], vec);
851                                 normalize_v3(mat[0]);
852                                 cross_v3_v3v3(mat[2], mat[0], mat[1]);
853                         }
854                 case 2:
855                         if (dot_v3v3(mat[2], mat[0]) < 1) {
856                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
857                                 normalize_v3(mat[1]);
858                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
859                         }
860                         else if (dot_v3v3(mat[2], mat[1]) < 1) {
861                                 cross_v3_v3v3(mat[0], mat[1], mat[2]);
862                                 normalize_v3(mat[0]);
863                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
864                         }
865                         else {
866                                 float vec[3];
867
868                                 vec[0] = mat[2][1];
869                                 vec[1] = mat[2][2];
870                                 vec[2] = mat[2][0];
871
872                                 cross_v3_v3v3(mat[0], vec, mat[2]);
873                                 normalize_v3(mat[0]);
874                                 cross_v3_v3v3(mat[1], mat[2], mat[0]);
875                         }
876         }
877         mul_v3_fl(mat[0], size[0]);
878         mul_v3_fl(mat[1], size[1]);
879         mul_v3_fl(mat[2], size[2]);
880 }
881
882 int is_orthogonal_m3(float m[3][3])
883 {
884         int i, j;
885
886         for (i = 0; i < 3; i++) {
887                 for (j = 0; j < i; j++) {
888                         if (fabsf(dot_v3v3(m[i], m[j])) > 1.5f * FLT_EPSILON)
889                                 return 0;
890                 }
891         }
892
893         return 1;
894 }
895
896 int is_orthogonal_m4(float m[4][4])
897 {
898         int i, j;
899
900         for (i = 0; i < 4; i++) {
901                 for (j = 0; j < i; j++) {
902                         if (fabsf(dot_vn_vn(m[i], m[j], 4)) > 1.5f * FLT_EPSILON)
903                                 return 0;
904                 }
905
906         }
907
908         return 1;
909 }
910
911 int is_orthonormal_m3(float m[3][3])
912 {
913         if (is_orthogonal_m3(m)) {
914                 int i;
915
916                 for (i = 0; i < 3; i++)
917                         if (fabsf(dot_v3v3(m[i], m[i]) - 1) > 1.5f * FLT_EPSILON)
918                                 return 0;
919
920                 return 1;
921         }
922
923         return 0;
924 }
925
926 int is_orthonormal_m4(float m[4][4])
927 {
928         if (is_orthogonal_m4(m)) {
929                 int i;
930
931                 for (i = 0; i < 4; i++)
932                         if (fabsf(dot_vn_vn(m[i], m[i], 4) - 1) > 1.5f * FLT_EPSILON)
933                                 return 0;
934
935                 return 1;
936         }
937
938         return 0;
939 }
940
941 int is_uniform_scaled_m3(float m[3][3])
942 {
943         const float eps = 1e-7;
944         float t[3][3];
945         float l1, l2, l3, l4, l5, l6;
946
947         copy_m3_m3(t, m);
948         transpose_m3(t);
949
950         l1 = len_squared_v3(m[0]);
951         l2 = len_squared_v3(m[1]);
952         l3 = len_squared_v3(m[2]);
953
954         l4 = len_squared_v3(t[0]);
955         l5 = len_squared_v3(t[1]);
956         l6 = len_squared_v3(t[2]);
957
958         if (fabsf(l2 - l1) <= eps &&
959             fabsf(l3 - l1) <= eps &&
960             fabsf(l4 - l1) <= eps &&
961             fabsf(l5 - l1) <= eps &&
962             fabsf(l6 - l1) <= eps)
963         {
964                 return 1;
965         }
966
967         return 0;
968 }
969
970 void normalize_m3(float mat[3][3])
971 {
972         normalize_v3(mat[0]);
973         normalize_v3(mat[1]);
974         normalize_v3(mat[2]);
975 }
976
977 void normalize_m3_m3(float rmat[3][3], float mat[3][3])
978 {
979         normalize_v3_v3(rmat[0], mat[0]);
980         normalize_v3_v3(rmat[1], mat[1]);
981         normalize_v3_v3(rmat[2], mat[2]);
982 }
983
984 void normalize_m4(float mat[4][4])
985 {
986         float len;
987
988         len = normalize_v3(mat[0]);
989         if (len != 0.0f) mat[0][3] /= len;
990         len = normalize_v3(mat[1]);
991         if (len != 0.0f) mat[1][3] /= len;
992         len = normalize_v3(mat[2]);
993         if (len != 0.0f) mat[2][3] /= len;
994 }
995
996 void normalize_m4_m4(float rmat[4][4], float mat[4][4])
997 {
998         copy_m4_m4(rmat, mat);
999         normalize_m4(rmat);
1000 }
1001
1002 void adjoint_m2_m2(float m1[2][2], float m[2][2])
1003 {
1004         BLI_assert(m1 != m);
1005         m1[0][0] =  m[1][1];
1006         m1[0][1] = -m[1][0];
1007         m1[1][0] = -m[0][1];
1008         m1[1][1] =  m[0][0];
1009 }
1010
1011 void adjoint_m3_m3(float m1[3][3], float m[3][3])
1012 {
1013         BLI_assert(m1 != m);
1014         m1[0][0] = m[1][1] * m[2][2] - m[1][2] * m[2][1];
1015         m1[0][1] = -m[0][1] * m[2][2] + m[0][2] * m[2][1];
1016         m1[0][2] = m[0][1] * m[1][2] - m[0][2] * m[1][1];
1017
1018         m1[1][0] = -m[1][0] * m[2][2] + m[1][2] * m[2][0];
1019         m1[1][1] = m[0][0] * m[2][2] - m[0][2] * m[2][0];
1020         m1[1][2] = -m[0][0] * m[1][2] + m[0][2] * m[1][0];
1021
1022         m1[2][0] = m[1][0] * m[2][1] - m[1][1] * m[2][0];
1023         m1[2][1] = -m[0][0] * m[2][1] + m[0][1] * m[2][0];
1024         m1[2][2] = m[0][0] * m[1][1] - m[0][1] * m[1][0];
1025 }
1026
1027 void adjoint_m4_m4(float out[4][4], float in[4][4]) /* out = ADJ(in) */
1028 {
1029         float a1, a2, a3, a4, b1, b2, b3, b4;
1030         float c1, c2, c3, c4, d1, d2, d3, d4;
1031
1032         a1 = in[0][0];
1033         b1 = in[0][1];
1034         c1 = in[0][2];
1035         d1 = in[0][3];
1036
1037         a2 = in[1][0];
1038         b2 = in[1][1];
1039         c2 = in[1][2];
1040         d2 = in[1][3];
1041
1042         a3 = in[2][0];
1043         b3 = in[2][1];
1044         c3 = in[2][2];
1045         d3 = in[2][3];
1046
1047         a4 = in[3][0];
1048         b4 = in[3][1];
1049         c4 = in[3][2];
1050         d4 = in[3][3];
1051
1052
1053         out[0][0] = determinant_m3(b2, b3, b4, c2, c3, c4, d2, d3, d4);
1054         out[1][0] = -determinant_m3(a2, a3, a4, c2, c3, c4, d2, d3, d4);
1055         out[2][0] = determinant_m3(a2, a3, a4, b2, b3, b4, d2, d3, d4);
1056         out[3][0] = -determinant_m3(a2, a3, a4, b2, b3, b4, c2, c3, c4);
1057
1058         out[0][1] = -determinant_m3(b1, b3, b4, c1, c3, c4, d1, d3, d4);
1059         out[1][1] = determinant_m3(a1, a3, a4, c1, c3, c4, d1, d3, d4);
1060         out[2][1] = -determinant_m3(a1, a3, a4, b1, b3, b4, d1, d3, d4);
1061         out[3][1] = determinant_m3(a1, a3, a4, b1, b3, b4, c1, c3, c4);
1062
1063         out[0][2] = determinant_m3(b1, b2, b4, c1, c2, c4, d1, d2, d4);
1064         out[1][2] = -determinant_m3(a1, a2, a4, c1, c2, c4, d1, d2, d4);
1065         out[2][2] = determinant_m3(a1, a2, a4, b1, b2, b4, d1, d2, d4);
1066         out[3][2] = -determinant_m3(a1, a2, a4, b1, b2, b4, c1, c2, c4);
1067
1068         out[0][3] = -determinant_m3(b1, b2, b3, c1, c2, c3, d1, d2, d3);
1069         out[1][3] = determinant_m3(a1, a2, a3, c1, c2, c3, d1, d2, d3);
1070         out[2][3] = -determinant_m3(a1, a2, a3, b1, b2, b3, d1, d2, d3);
1071         out[3][3] = determinant_m3(a1, a2, a3, b1, b2, b3, c1, c2, c3);
1072 }
1073
1074 float determinant_m2(float a, float b, float c, float d)
1075 {
1076
1077         return a * d - b * c;
1078 }
1079
1080 float determinant_m3(float a1, float a2, float a3,
1081                      float b1, float b2, float b3,
1082                      float c1, float c2, float c3)
1083 {
1084         float ans;
1085
1086         ans = (a1 * determinant_m2(b2, b3, c2, c3) -
1087                b1 * determinant_m2(a2, a3, c2, c3) +
1088                c1 * determinant_m2(a2, a3, b2, b3));
1089
1090         return ans;
1091 }
1092
1093 float determinant_m4(float m[4][4])
1094 {
1095         float ans;
1096         float a1, a2, a3, a4, b1, b2, b3, b4, c1, c2, c3, c4, d1, d2, d3, d4;
1097
1098         a1 = m[0][0];
1099         b1 = m[0][1];
1100         c1 = m[0][2];
1101         d1 = m[0][3];
1102
1103         a2 = m[1][0];
1104         b2 = m[1][1];
1105         c2 = m[1][2];
1106         d2 = m[1][3];
1107
1108         a3 = m[2][0];
1109         b3 = m[2][1];
1110         c3 = m[2][2];
1111         d3 = m[2][3];
1112
1113         a4 = m[3][0];
1114         b4 = m[3][1];
1115         c4 = m[3][2];
1116         d4 = m[3][3];
1117
1118         ans = (a1 * determinant_m3(b2, b3, b4, c2, c3, c4, d2, d3, d4) -
1119                b1 * determinant_m3(a2, a3, a4, c2, c3, c4, d2, d3, d4) +
1120                c1 * determinant_m3(a2, a3, a4, b2, b3, b4, d2, d3, d4) -
1121                d1 * determinant_m3(a2, a3, a4, b2, b3, b4, c2, c3, c4));
1122
1123         return ans;
1124 }
1125
1126 /****************************** Transformations ******************************/
1127
1128 void size_to_mat3(float mat[3][3], const float size[3])
1129 {
1130         mat[0][0] = size[0];
1131         mat[0][1] = 0.0f;
1132         mat[0][2] = 0.0f;
1133         mat[1][1] = size[1];
1134         mat[1][0] = 0.0f;
1135         mat[1][2] = 0.0f;
1136         mat[2][2] = size[2];
1137         mat[2][1] = 0.0f;
1138         mat[2][0] = 0.0f;
1139 }
1140
1141 void size_to_mat4(float mat[4][4], const float size[3])
1142 {
1143         float tmat[3][3];
1144
1145         size_to_mat3(tmat, size);
1146         unit_m4(mat);
1147         copy_m4_m3(mat, tmat);
1148 }
1149
1150 void mat3_to_size(float size[3], float mat[3][3])
1151 {
1152         size[0] = len_v3(mat[0]);
1153         size[1] = len_v3(mat[1]);
1154         size[2] = len_v3(mat[2]);
1155 }
1156
1157 void mat4_to_size(float size[3], float mat[4][4])
1158 {
1159         size[0] = len_v3(mat[0]);
1160         size[1] = len_v3(mat[1]);
1161         size[2] = len_v3(mat[2]);
1162 }
1163
1164 /* this gets the average scale of a matrix, only use when your scaling
1165  * data that has no idea of scale axis, examples are bone-envelope-radius
1166  * and curve radius */
1167 float mat3_to_scale(float mat[3][3])
1168 {
1169         /* unit length vector */
1170         float unit_vec[3] = {0.577350269189626f, 0.577350269189626f, 0.577350269189626f};
1171         mul_m3_v3(mat, unit_vec);
1172         return len_v3(unit_vec);
1173 }
1174
1175 float mat4_to_scale(float mat[4][4])
1176 {
1177         float tmat[3][3];
1178         copy_m3_m4(tmat, mat);
1179         return mat3_to_scale(tmat);
1180 }
1181
1182 void mat3_to_rot_size(float rot[3][3], float size[3], float mat3[3][3])
1183 {
1184         float mat3_n[3][3]; /* mat3 -> normalized, 3x3 */
1185         float imat3_n[3][3]; /* mat3 -> normalized & inverted, 3x3 */
1186
1187         /* rotation & scale are linked, we need to create the mat's
1188          * for these together since they are related. */
1189
1190         /* so scale doesn't interfere with rotation [#24291] */
1191         /* note: this is a workaround for negative matrix not working for rotation conversion, FIXME */
1192         normalize_m3_m3(mat3_n, mat3);
1193         if (is_negative_m3(mat3)) {
1194                 negate_v3(mat3_n[0]);
1195                 negate_v3(mat3_n[1]);
1196                 negate_v3(mat3_n[2]);
1197         }
1198
1199         /* rotation */
1200         /* keep rot as a 3x3 matrix, the caller can convert into a quat or euler */
1201         copy_m3_m3(rot, mat3_n);
1202
1203         /* scale */
1204         /* note: mat4_to_size(ob->size, mat) fails for negative scale */
1205         invert_m3_m3(imat3_n, mat3_n);
1206         mul_m3_m3m3(mat3, imat3_n, mat3);
1207
1208         size[0] = mat3[0][0];
1209         size[1] = mat3[1][1];
1210         size[2] = mat3[2][2];
1211 }
1212
1213 void mat4_to_loc_rot_size(float loc[3], float rot[3][3], float size[3], float wmat[4][4])
1214 {
1215         float mat3[3][3]; /* wmat -> 3x3 */
1216
1217         copy_m3_m4(mat3, wmat);
1218         mat3_to_rot_size(rot, size, mat3);
1219
1220         /* location */
1221         copy_v3_v3(loc, wmat[3]);
1222 }
1223
1224 void mat4_to_loc_quat(float loc[3], float quat[4], float wmat[4][4])
1225 {
1226         float mat3[3][3];
1227         float mat3_n[3][3]; /* normalized mat3 */
1228
1229         copy_m3_m4(mat3, wmat);
1230         normalize_m3_m3(mat3_n, mat3);
1231
1232         /* so scale doesn't interfere with rotation [#24291] */
1233         /* note: this is a workaround for negative matrix not working for rotation conversion, FIXME */
1234         if (is_negative_m3(mat3)) {
1235                 negate_v3(mat3_n[0]);
1236                 negate_v3(mat3_n[1]);
1237                 negate_v3(mat3_n[2]);
1238         }
1239
1240         mat3_to_quat(quat, mat3_n);
1241         copy_v3_v3(loc, wmat[3]);
1242 }
1243
1244 void mat4_decompose(float loc[3], float quat[4], float size[3], float wmat[4][4])
1245 {
1246         float rot[3][3];
1247         mat4_to_loc_rot_size(loc, rot, size, wmat);
1248         mat3_to_quat(quat, rot);
1249 }
1250
1251 void scale_m3_fl(float m[3][3], float scale)
1252 {
1253         m[0][0] = m[1][1] = m[2][2] = scale;
1254         m[0][1] = m[0][2] = 0.0;
1255         m[1][0] = m[1][2] = 0.0;
1256         m[2][0] = m[2][1] = 0.0;
1257 }
1258
1259 void scale_m4_fl(float m[4][4], float scale)
1260 {
1261         m[0][0] = m[1][1] = m[2][2] = scale;
1262         m[3][3] = 1.0;
1263         m[0][1] = m[0][2] = m[0][3] = 0.0;
1264         m[1][0] = m[1][2] = m[1][3] = 0.0;
1265         m[2][0] = m[2][1] = m[2][3] = 0.0;
1266         m[3][0] = m[3][1] = m[3][2] = 0.0;
1267 }
1268
1269 void translate_m4(float mat[4][4], float Tx, float Ty, float Tz)
1270 {
1271         mat[3][0] += (Tx * mat[0][0] + Ty * mat[1][0] + Tz * mat[2][0]);
1272         mat[3][1] += (Tx * mat[0][1] + Ty * mat[1][1] + Tz * mat[2][1]);
1273         mat[3][2] += (Tx * mat[0][2] + Ty * mat[1][2] + Tz * mat[2][2]);
1274 }
1275
1276 void rotate_m4(float mat[4][4], const char axis, const float angle)
1277 {
1278         int col;
1279         float temp[4] = {0.0f, 0.0f, 0.0f, 0.0f};
1280         float cosine, sine;
1281
1282         assert(axis >= 'X' && axis <= 'Z');
1283
1284         cosine = cosf(angle);
1285         sine   = sinf(angle);
1286         switch (axis) {
1287                 case 'X':
1288                         for (col = 0; col < 4; col++)
1289                                 temp[col] = cosine * mat[1][col] + sine * mat[2][col];
1290                         for (col = 0; col < 4; col++) {
1291                                 mat[2][col] = -sine * mat[1][col] + cosine * mat[2][col];
1292                                 mat[1][col] = temp[col];
1293                         }
1294                         break;
1295
1296                 case 'Y':
1297                         for (col = 0; col < 4; col++)
1298                                 temp[col] = cosine * mat[0][col] - sine * mat[2][col];
1299                         for (col = 0; col < 4; col++) {
1300                                 mat[2][col] = sine * mat[0][col] + cosine * mat[2][col];
1301                                 mat[0][col] = temp[col];
1302                         }
1303                         break;
1304
1305                 case 'Z':
1306                         for (col = 0; col < 4; col++)
1307                                 temp[col] = cosine * mat[0][col] + sine * mat[1][col];
1308                         for (col = 0; col < 4; col++) {
1309                                 mat[1][col] = -sine * mat[0][col] + cosine * mat[1][col];
1310                                 mat[0][col] = temp[col];
1311                         }
1312                         break;
1313         }
1314 }
1315
1316 void rotate_m2(float mat[2][2], const float angle)
1317 {
1318         mat[0][0] = mat[1][1] = cosf(angle);
1319         mat[0][1] = sinf(angle);
1320         mat[1][0] = -mat[0][1];
1321 }
1322
1323 void blend_m3_m3m3(float out[3][3], float dst[3][3], float src[3][3], const float srcweight)
1324 {
1325         float srot[3][3], drot[3][3];
1326         float squat[4], dquat[4], fquat[4];
1327         float sscale[3], dscale[3], fsize[3];
1328         float rmat[3][3], smat[3][3];
1329
1330         mat3_to_rot_size(drot, dscale, dst);
1331         mat3_to_rot_size(srot, sscale, src);
1332
1333         mat3_to_quat(dquat, drot);
1334         mat3_to_quat(squat, srot);
1335
1336         /* do blending */
1337         interp_qt_qtqt(fquat, dquat, squat, srcweight);
1338         interp_v3_v3v3(fsize, dscale, sscale, srcweight);
1339
1340         /* compose new matrix */
1341         quat_to_mat3(rmat, fquat);
1342         size_to_mat3(smat, fsize);
1343         mul_m3_m3m3(out, rmat, smat);
1344 }
1345
1346 void blend_m4_m4m4(float out[4][4], float dst[4][4], float src[4][4], const float srcweight)
1347 {
1348         float sloc[3], dloc[3], floc[3];
1349         float srot[3][3], drot[3][3];
1350         float squat[4], dquat[4], fquat[4];
1351         float sscale[3], dscale[3], fsize[3];
1352
1353         mat4_to_loc_rot_size(dloc, drot, dscale, dst);
1354         mat4_to_loc_rot_size(sloc, srot, sscale, src);
1355
1356         mat3_to_quat(dquat, drot);
1357         mat3_to_quat(squat, srot);
1358
1359         /* do blending */
1360         interp_v3_v3v3(floc, dloc, sloc, srcweight);
1361         interp_qt_qtqt(fquat, dquat, squat, srcweight);
1362         interp_v3_v3v3(fsize, dscale, sscale, srcweight);
1363
1364         /* compose new matrix */
1365         loc_quat_size_to_mat4(out, floc, fquat, fsize);
1366 }
1367
1368 int is_negative_m3(float mat[3][3])
1369 {
1370         float vec[3];
1371         cross_v3_v3v3(vec, mat[0], mat[1]);
1372         return (dot_v3v3(vec, mat[2]) < 0.0f);
1373 }
1374
1375 int is_negative_m4(float mat[4][4])
1376 {
1377         float vec[3];
1378         cross_v3_v3v3(vec, mat[0], mat[1]);
1379         return (dot_v3v3(vec, mat[2]) < 0.0f);
1380 }
1381
1382 /* make a 4x4 matrix out of 3 transform components */
1383 /* matrices are made in the order: scale * rot * loc */
1384 /* TODO: need to have a version that allows for rotation order... */
1385
1386 void loc_eul_size_to_mat4(float mat[4][4], const float loc[3], const float eul[3], const float size[3])
1387 {
1388         float rmat[3][3], smat[3][3], tmat[3][3];
1389
1390         /* initialize new matrix */
1391         unit_m4(mat);
1392
1393         /* make rotation + scaling part */
1394         eul_to_mat3(rmat, eul);
1395         size_to_mat3(smat, size);
1396         mul_m3_m3m3(tmat, rmat, smat);
1397
1398         /* copy rot/scale part to output matrix*/
1399         copy_m4_m3(mat, tmat);
1400
1401         /* copy location to matrix */
1402         mat[3][0] = loc[0];
1403         mat[3][1] = loc[1];
1404         mat[3][2] = loc[2];
1405 }
1406
1407 /* make a 4x4 matrix out of 3 transform components */
1408
1409 /* matrices are made in the order: scale * rot * loc */
1410 void loc_eulO_size_to_mat4(float mat[4][4], const float loc[3], const float eul[3], const float size[3], const short rotOrder)
1411 {
1412         float rmat[3][3], smat[3][3], tmat[3][3];
1413
1414         /* initialize new matrix */
1415         unit_m4(mat);
1416
1417         /* make rotation + scaling part */
1418         eulO_to_mat3(rmat, eul, rotOrder);
1419         size_to_mat3(smat, size);
1420         mul_m3_m3m3(tmat, rmat, smat);
1421
1422         /* copy rot/scale part to output matrix*/
1423         copy_m4_m3(mat, tmat);
1424
1425         /* copy location to matrix */
1426         mat[3][0] = loc[0];
1427         mat[3][1] = loc[1];
1428         mat[3][2] = loc[2];
1429 }
1430
1431
1432 /* make a 4x4 matrix out of 3 transform components */
1433
1434 /* matrices are made in the order: scale * rot * loc */
1435 void loc_quat_size_to_mat4(float mat[4][4], const float loc[3], const float quat[4], const float size[3])
1436 {
1437         float rmat[3][3], smat[3][3], tmat[3][3];
1438
1439         /* initialize new matrix */
1440         unit_m4(mat);
1441
1442         /* make rotation + scaling part */
1443         quat_to_mat3(rmat, quat);
1444         size_to_mat3(smat, size);
1445         mul_m3_m3m3(tmat, rmat, smat);
1446
1447         /* copy rot/scale part to output matrix*/
1448         copy_m4_m3(mat, tmat);
1449
1450         /* copy location to matrix */
1451         mat[3][0] = loc[0];
1452         mat[3][1] = loc[1];
1453         mat[3][2] = loc[2];
1454 }
1455
1456 void loc_axisangle_size_to_mat4(float mat[4][4], const float loc[3], const float axis[3], const float angle, const float size[3])
1457 {
1458         float q[4];
1459         axis_angle_to_quat(q, axis, angle);
1460         loc_quat_size_to_mat4(mat, loc, q, size);
1461 }
1462
1463 /*********************************** Other ***********************************/
1464
1465 void print_m3(const char *str, float m[3][3])
1466 {
1467         printf("%s\n", str);
1468         printf("%f %f %f\n", m[0][0], m[1][0], m[2][0]);
1469         printf("%f %f %f\n", m[0][1], m[1][1], m[2][1]);
1470         printf("%f %f %f\n", m[0][2], m[1][2], m[2][2]);
1471         printf("\n");
1472 }
1473
1474 void print_m4(const char *str, float m[4][4])
1475 {
1476         printf("%s\n", str);
1477         printf("%f %f %f %f\n", m[0][0], m[1][0], m[2][0], m[3][0]);
1478         printf("%f %f %f %f\n", m[0][1], m[1][1], m[2][1], m[3][1]);
1479         printf("%f %f %f %f\n", m[0][2], m[1][2], m[2][2], m[3][2]);
1480         printf("%f %f %f %f\n", m[0][3], m[1][3], m[2][3], m[3][3]);
1481         printf("\n");
1482 }
1483
1484 /*********************************** SVD ************************************
1485  * from TNT matrix library
1486  *
1487  * Compute the Single Value Decomposition of an arbitrary matrix A
1488  * That is compute the 3 matrices U,W,V with U column orthogonal (m,n)
1489  * ,W a diagonal matrix and V an orthogonal square matrix s.t.
1490  * A = U.W.Vt. From this decomposition it is trivial to compute the
1491  * (pseudo-inverse) of A as Ainv = V.Winv.tranpose(U).
1492  */
1493
1494 void svd_m4(float U[4][4], float s[4], float V[4][4], float A_[4][4])
1495 {
1496         float A[4][4];
1497         float work1[4], work2[4];
1498         int m = 4;
1499         int n = 4;
1500         int maxiter = 200;
1501         int nu = min_ff(m, n);
1502
1503         float *work = work1;
1504         float *e = work2;
1505         float eps;
1506
1507         int i = 0, j = 0, k = 0, p, pp, iter;
1508
1509         /* Reduce A to bidiagonal form, storing the diagonal elements
1510          * in s and the super-diagonal elements in e. */
1511
1512         int nct = min_ff(m - 1, n);
1513         int nrt = max_ff(0, min_ff(n - 2, m));
1514
1515         copy_m4_m4(A, A_);
1516         zero_m4(U);
1517         zero_v4(s);
1518
1519         for (k = 0; k < max_ff(nct, nrt); k++) {
1520                 if (k < nct) {
1521
1522                         /* Compute the transformation for the k-th column and
1523                          * place the k-th diagonal in s[k].
1524                          * Compute 2-norm of k-th column without under/overflow. */
1525                         s[k] = 0;
1526                         for (i = k; i < m; i++) {
1527                                 s[k] = hypotf(s[k], A[i][k]);
1528                         }
1529                         if (s[k] != 0.0f) {
1530                                 float invsk;
1531                                 if (A[k][k] < 0.0f) {
1532                                         s[k] = -s[k];
1533                                 }
1534                                 invsk = 1.0f / s[k];
1535                                 for (i = k; i < m; i++) {
1536                                         A[i][k] *= invsk;
1537                                 }
1538                                 A[k][k] += 1.0f;
1539                         }
1540                         s[k] = -s[k];
1541                 }
1542                 for (j = k + 1; j < n; j++) {
1543                         if ((k < nct) && (s[k] != 0.0f)) {
1544
1545                                 /* Apply the transformation. */
1546
1547                                 float t = 0;
1548                                 for (i = k; i < m; i++) {
1549                                         t += A[i][k] * A[i][j];
1550                                 }
1551                                 t = -t / A[k][k];
1552                                 for (i = k; i < m; i++) {
1553                                         A[i][j] += t * A[i][k];
1554                                 }
1555                         }
1556
1557                         /* Place the k-th row of A into e for the */
1558                         /* subsequent calculation of the row transformation. */
1559
1560                         e[j] = A[k][j];
1561                 }
1562                 if (k < nct) {
1563
1564                         /* Place the transformation in U for subsequent back
1565                          * multiplication. */
1566
1567                         for (i = k; i < m; i++)
1568                                 U[i][k] = A[i][k];
1569                 }
1570                 if (k < nrt) {
1571
1572                         /* Compute the k-th row transformation and place the
1573                          * k-th super-diagonal in e[k].
1574                          * Compute 2-norm without under/overflow. */
1575                         e[k] = 0;
1576                         for (i = k + 1; i < n; i++) {
1577                                 e[k] = hypotf(e[k], e[i]);
1578                         }
1579                         if (e[k] != 0.0f) {
1580                                 float invek;
1581                                 if (e[k + 1] < 0.0f) {
1582                                         e[k] = -e[k];
1583                                 }
1584                                 invek = 1.0f / e[k];
1585                                 for (i = k + 1; i < n; i++) {
1586                                         e[i] *= invek;
1587                                 }
1588                                 e[k + 1] += 1.0f;
1589                         }
1590                         e[k] = -e[k];
1591                         if ((k + 1 < m) & (e[k] != 0.0f)) {
1592                                 float invek1;
1593
1594                                 /* Apply the transformation. */
1595
1596                                 for (i = k + 1; i < m; i++) {
1597                                         work[i] = 0.0f;
1598                                 }
1599                                 for (j = k + 1; j < n; j++) {
1600                                         for (i = k + 1; i < m; i++) {
1601                                                 work[i] += e[j] * A[i][j];
1602                                         }
1603                                 }
1604                                 invek1 = 1.0f / e[k + 1];
1605                                 for (j = k + 1; j < n; j++) {
1606                                         float t = -e[j] * invek1;
1607                                         for (i = k + 1; i < m; i++) {
1608                                                 A[i][j] += t * work[i];
1609                                         }
1610                                 }
1611                         }
1612
1613                         /* Place the transformation in V for subsequent
1614                          * back multiplication. */
1615
1616                         for (i = k + 1; i < n; i++)
1617                                 V[i][k] = e[i];
1618                 }
1619         }
1620
1621         /* Set up the final bidiagonal matrix or order p. */
1622
1623         p = min_ff(n, m + 1);
1624         if (nct < n) {
1625                 s[nct] = A[nct][nct];
1626         }
1627         if (m < p) {
1628                 s[p - 1] = 0.0f;
1629         }
1630         if (nrt + 1 < p) {
1631                 e[nrt] = A[nrt][p - 1];
1632         }
1633         e[p - 1] = 0.0f;
1634
1635         /* If required, generate U. */
1636
1637         for (j = nct; j < nu; j++) {
1638                 for (i = 0; i < m; i++) {
1639                         U[i][j] = 0.0f;
1640                 }
1641                 U[j][j] = 1.0f;
1642         }
1643         for (k = nct - 1; k >= 0; k--) {
1644                 if (s[k] != 0.0f) {
1645                         for (j = k + 1; j < nu; j++) {
1646                                 float t = 0;
1647                                 for (i = k; i < m; i++) {
1648                                         t += U[i][k] * U[i][j];
1649                                 }
1650                                 t = -t / U[k][k];
1651                                 for (i = k; i < m; i++) {
1652                                         U[i][j] += t * U[i][k];
1653                                 }
1654                         }
1655                         for (i = k; i < m; i++) {
1656                                 U[i][k] = -U[i][k];
1657                         }
1658                         U[k][k] = 1.0f + U[k][k];
1659                         for (i = 0; i < k - 1; i++) {
1660                                 U[i][k] = 0.0f;
1661                         }
1662                 }
1663                 else {
1664                         for (i = 0; i < m; i++) {
1665                                 U[i][k] = 0.0f;
1666                         }
1667                         U[k][k] = 1.0f;
1668                 }
1669         }
1670
1671         /* If required, generate V. */
1672
1673         for (k = n - 1; k >= 0; k--) {
1674                 if ((k < nrt) & (e[k] != 0.0f)) {
1675                         for (j = k + 1; j < nu; j++) {
1676                                 float t = 0;
1677                                 for (i = k + 1; i < n; i++) {
1678                                         t += V[i][k] * V[i][j];
1679                                 }
1680                                 t = -t / V[k + 1][k];
1681                                 for (i = k + 1; i < n; i++) {
1682                                         V[i][j] += t * V[i][k];
1683                                 }
1684                         }
1685                 }
1686                 for (i = 0; i < n; i++) {
1687                         V[i][k] = 0.0f;
1688                 }
1689                 V[k][k] = 1.0f;
1690         }
1691
1692         /* Main iteration loop for the singular values. */
1693
1694         pp = p - 1;
1695         iter = 0;
1696         eps = powf(2.0f, -52.0f);
1697         while (p > 0) {
1698                 int kase = 0;
1699
1700                 /* Test for maximum iterations to avoid infinite loop */
1701                 if (maxiter == 0)
1702                         break;
1703                 maxiter--;
1704
1705                 /* This section of the program inspects for
1706                  * negligible elements in the s and e arrays.  On
1707                  * completion the variables kase and k are set as follows.
1708                  *
1709                  * kase = 1       if s(p) and e[k - 1] are negligible and k<p
1710                  * kase = 2       if s(k) is negligible and k<p
1711                  * kase = 3       if e[k - 1] is negligible, k<p, and
1712                  *               s(k), ..., s(p) are not negligible (qr step).
1713                  * kase = 4       if e(p - 1) is negligible (convergence). */
1714
1715                 for (k = p - 2; k >= -1; k--) {
1716                         if (k == -1) {
1717                                 break;
1718                         }
1719                         if (fabsf(e[k]) <= eps * (fabsf(s[k]) + fabsf(s[k + 1]))) {
1720                                 e[k] = 0.0f;
1721                                 break;
1722                         }
1723                 }
1724                 if (k == p - 2) {
1725                         kase = 4;
1726                 }
1727                 else {
1728                         int ks;
1729                         for (ks = p - 1; ks >= k; ks--) {
1730                                 float t;
1731                                 if (ks == k) {
1732                                         break;
1733                                 }
1734                                 t = (ks != p ? fabsf(e[ks]) : 0.f) +
1735                                     (ks != k + 1 ? fabsf(e[ks - 1]) : 0.0f);
1736                                 if (fabsf(s[ks]) <= eps * t) {
1737                                         s[ks] = 0.0f;
1738                                         break;
1739                                 }
1740                         }
1741                         if (ks == k) {
1742                                 kase = 3;
1743                         }
1744                         else if (ks == p - 1) {
1745                                 kase = 1;
1746                         }
1747                         else {
1748                                 kase = 2;
1749                                 k = ks;
1750                         }
1751                 }
1752                 k++;
1753
1754                 /* Perform the task indicated by kase. */
1755
1756                 switch (kase) {
1757
1758                         /* Deflate negligible s(p). */
1759
1760                         case 1:
1761                         {
1762                                 float f = e[p - 2];
1763                                 e[p - 2] = 0.0f;
1764                                 for (j = p - 2; j >= k; j--) {
1765                                         float t = hypotf(s[j], f);
1766                                         float invt = 1.0f / t;
1767                                         float cs = s[j] * invt;
1768                                         float sn = f * invt;
1769                                         s[j] = t;
1770                                         if (j != k) {
1771                                                 f = -sn * e[j - 1];
1772                                                 e[j - 1] = cs * e[j - 1];
1773                                         }
1774
1775                                         for (i = 0; i < n; i++) {
1776                                                 t = cs * V[i][j] + sn * V[i][p - 1];
1777                                                 V[i][p - 1] = -sn * V[i][j] + cs * V[i][p - 1];
1778                                                 V[i][j] = t;
1779                                         }
1780                                 }
1781                                 break;
1782                         }
1783
1784                         /* Split at negligible s(k). */
1785
1786                         case 2:
1787                         {
1788                                 float f = e[k - 1];
1789                                 e[k - 1] = 0.0f;
1790                                 for (j = k; j < p; j++) {
1791                                         float t = hypotf(s[j], f);
1792                                         float invt = 1.0f / t;
1793                                         float cs = s[j] * invt;
1794                                         float sn = f * invt;
1795                                         s[j] = t;
1796                                         f = -sn * e[j];
1797                                         e[j] = cs * e[j];
1798
1799                                         for (i = 0; i < m; i++) {
1800                                                 t = cs * U[i][j] + sn * U[i][k - 1];
1801                                                 U[i][k - 1] = -sn * U[i][j] + cs * U[i][k - 1];
1802                                                 U[i][j] = t;
1803                                         }
1804                                 }
1805                                 break;
1806                         }
1807
1808                         /* Perform one qr step. */
1809
1810                         case 3:
1811                         {
1812
1813                                 /* Calculate the shift. */
1814
1815                                 float scale = max_ff(max_ff(max_ff(max_ff(
1816                                                    fabsf(s[p - 1]), fabsf(s[p - 2])), fabsf(e[p - 2])),
1817                                                    fabsf(s[k])), fabsf(e[k]));
1818                                 float invscale = 1.0f / scale;
1819                                 float sp = s[p - 1] * invscale;
1820                                 float spm1 = s[p - 2] * invscale;
1821                                 float epm1 = e[p - 2] * invscale;
1822                                 float sk = s[k] * invscale;
1823                                 float ek = e[k] * invscale;
1824                                 float b = ((spm1 + sp) * (spm1 - sp) + epm1 * epm1) * 0.5f;
1825                                 float c = (sp * epm1) * (sp * epm1);
1826                                 float shift = 0.0f;
1827                                 float f, g;
1828                                 if ((b != 0.0f) || (c != 0.0f)) {
1829                                         shift = sqrtf(b * b + c);
1830                                         if (b < 0.0f) {
1831                                                 shift = -shift;
1832                                         }
1833                                         shift = c / (b + shift);
1834                                 }
1835                                 f = (sk + sp) * (sk - sp) + shift;
1836                                 g = sk * ek;
1837
1838                                 /* Chase zeros. */
1839
1840                                 for (j = k; j < p - 1; j++) {
1841                                         float t = hypotf(f, g);
1842                                         /* division by zero checks added to avoid NaN (brecht) */
1843                                         float cs = (t == 0.0f) ? 0.0f : f / t;
1844                                         float sn = (t == 0.0f) ? 0.0f : g / t;
1845                                         if (j != k) {
1846                                                 e[j - 1] = t;
1847                                         }
1848                                         f = cs * s[j] + sn * e[j];
1849                                         e[j] = cs * e[j] - sn * s[j];
1850                                         g = sn * s[j + 1];
1851                                         s[j + 1] = cs * s[j + 1];
1852
1853                                         for (i = 0; i < n; i++) {
1854                                                 t = cs * V[i][j] + sn * V[i][j + 1];
1855                                                 V[i][j + 1] = -sn * V[i][j] + cs * V[i][j + 1];
1856                                                 V[i][j] = t;
1857                                         }
1858
1859                                         t = hypotf(f, g);
1860                                         /* division by zero checks added to avoid NaN (brecht) */
1861                                         cs = (t == 0.0f) ? 0.0f : f / t;
1862                                         sn = (t == 0.0f) ? 0.0f : g / t;
1863                                         s[j] = t;
1864                                         f = cs * e[j] + sn * s[j + 1];
1865                                         s[j + 1] = -sn * e[j] + cs * s[j + 1];
1866                                         g = sn * e[j + 1];
1867                                         e[j + 1] = cs * e[j + 1];
1868                                         if (j < m - 1) {
1869                                                 for (i = 0; i < m; i++) {
1870                                                         t = cs * U[i][j] + sn * U[i][j + 1];
1871                                                         U[i][j + 1] = -sn * U[i][j] + cs * U[i][j + 1];
1872                                                         U[i][j] = t;
1873                                                 }
1874                                         }
1875                                 }
1876                                 e[p - 2] = f;
1877                                 iter = iter + 1;
1878                                 break;
1879                         }
1880                         /* Convergence. */
1881
1882                         case 4:
1883                         {
1884
1885                                 /* Make the singular values positive. */
1886
1887                                 if (s[k] <= 0.0f) {
1888                                         s[k] = (s[k] < 0.0f ? -s[k] : 0.0f);
1889
1890                                         for (i = 0; i <= pp; i++)
1891                                                 V[i][k] = -V[i][k];
1892                                 }
1893
1894                                 /* Order the singular values. */
1895
1896                                 while (k < pp) {
1897                                         float t;
1898                                         if (s[k] >= s[k + 1]) {
1899                                                 break;
1900                                         }
1901                                         t = s[k];
1902                                         s[k] = s[k + 1];
1903                                         s[k + 1] = t;
1904                                         if (k < n - 1) {
1905                                                 for (i = 0; i < n; i++) {
1906                                                         t = V[i][k + 1];
1907                                                         V[i][k + 1] = V[i][k];
1908                                                         V[i][k] = t;
1909                                                 }
1910                                         }
1911                                         if (k < m - 1) {
1912                                                 for (i = 0; i < m; i++) {
1913                                                         t = U[i][k + 1];
1914                                                         U[i][k + 1] = U[i][k];
1915                                                         U[i][k] = t;
1916                                                 }
1917                                         }
1918                                         k++;
1919                                 }
1920                                 iter = 0;
1921                                 p--;
1922                                 break;
1923                         }
1924                 }
1925         }
1926 }
1927
1928 void pseudoinverse_m4_m4(float Ainv[4][4], float A[4][4], float epsilon)
1929 {
1930         /* compute moon-penrose pseudo inverse of matrix, singular values
1931          * below epsilon are ignored for stability (truncated SVD) */
1932         float V[4][4], W[4], Wm[4][4], U[4][4];
1933         int i;
1934
1935         transpose_m4(A);
1936         svd_m4(V, W, U, A);
1937         transpose_m4(U);
1938         transpose_m4(V);
1939
1940         zero_m4(Wm);
1941         for (i = 0; i < 4; i++)
1942                 Wm[i][i] = (W[i] < epsilon) ? 0.0f : 1.0f / W[i];
1943
1944         transpose_m4(V);
1945
1946         mul_serie_m4(Ainv, U, Wm, V, NULL, NULL, NULL, NULL, NULL);
1947 }
1948
1949 void pseudoinverse_m3_m3(float Ainv[3][3], float A[3][3], float epsilon)
1950 {
1951         /* try regular inverse when possible, otherwise fall back to slow svd */
1952         if (!invert_m3_m3(Ainv, A)) {
1953                 float tmp[4][4], tmpinv[4][4];
1954
1955                 copy_m4_m3(tmp, A);
1956                 pseudoinverse_m4_m4(tmpinv, tmp, epsilon);
1957                 copy_m3_m4(Ainv, tmpinv);
1958         }
1959 }
1960