788ebe4119fe5b8a1fb50ad54cf32c31220f0e65
[blender.git] / source / blender / blenkernel / intern / mesh_evaluate.c
1 /*
2  * ***** BEGIN GPL LICENSE BLOCK *****
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public License
6  * as published by the Free Software Foundation; either version 2
7  * of the License, or (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software Foundation,
16  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
17  *
18  * The Original Code is Copyright (C) 2001-2002 by NaN Holding BV.
19  * All rights reserved.
20  *
21  * Contributor(s): Blender Foundation
22  *
23  * ***** END GPL LICENSE BLOCK *****
24  */
25
26 /** \file blender/blenkernel/intern/mesh_evaluate.c
27  *  \ingroup bke
28  *
29  * Functions to evaluate mesh data.
30  */
31
32 #include <limits.h>
33
34 #include "MEM_guardedalloc.h"
35
36 #include "DNA_object_types.h"
37 #include "DNA_mesh_types.h"
38 #include "DNA_meshdata_types.h"
39
40 #include "BLI_utildefines.h"
41 #include "BLI_memarena.h"
42 #include "BLI_mempool.h"
43 #include "BLI_math.h"
44 #include "BLI_edgehash.h"
45 #include "BLI_bitmap.h"
46 #include "BLI_polyfill_2d.h"
47 #include "BLI_linklist.h"
48 #include "BLI_linklist_stack.h"
49 #include "BLI_alloca.h"
50 #include "BLI_stack.h"
51 #include "BLI_task.h"
52
53 #include "BKE_customdata.h"
54 #include "BKE_global.h"
55 #include "BKE_mesh.h"
56 #include "BKE_multires.h"
57 #include "BKE_report.h"
58
59 #include "BLI_strict_flags.h"
60
61 #include "atomic_ops.h"
62 #include "mikktspace.h"
63
64 // #define DEBUG_TIME
65
66 #include "PIL_time.h"
67 #ifdef DEBUG_TIME
68 #  include "PIL_time_utildefines.h"
69 #endif
70
71 /* -------------------------------------------------------------------- */
72
73 /** \name Mesh Normal Calculation
74  * \{ */
75
76 /**
77  * Call when there are no polygons.
78  */
79 static void mesh_calc_normals_vert_fallback(MVert *mverts, int numVerts)
80 {
81         int i;
82         for (i = 0; i < numVerts; i++) {
83                 MVert *mv = &mverts[i];
84                 float no[3];
85
86                 normalize_v3_v3(no, mv->co);
87                 normal_float_to_short_v3(mv->no, no);
88         }
89 }
90
91 /* Calculate vertex and face normals, face normals are returned in *r_faceNors if non-NULL
92  * and vertex normals are stored in actual mverts.
93  */
94 void BKE_mesh_calc_normals_mapping(
95         MVert *mverts, int numVerts,
96         const MLoop *mloop, const MPoly *mpolys, int numLoops, int numPolys, float (*r_polyNors)[3],
97         const MFace *mfaces, int numFaces, const int *origIndexFace, float (*r_faceNors)[3])
98 {
99         BKE_mesh_calc_normals_mapping_ex(
100                 mverts, numVerts, mloop, mpolys,
101                 numLoops, numPolys, r_polyNors, mfaces, numFaces,
102                 origIndexFace, r_faceNors, false);
103 }
104 /* extended version of 'BKE_mesh_calc_normals_poly' with option not to calc vertex normals */
105 void BKE_mesh_calc_normals_mapping_ex(
106         MVert *mverts, int numVerts,
107         const MLoop *mloop, const MPoly *mpolys,
108         int numLoops, int numPolys, float (*r_polyNors)[3],
109         const MFace *mfaces, int numFaces, const int *origIndexFace, float (*r_faceNors)[3],
110         const bool only_face_normals)
111 {
112         float (*pnors)[3] = r_polyNors, (*fnors)[3] = r_faceNors;
113         int i;
114         const MFace *mf;
115         const MPoly *mp;
116
117         if (numPolys == 0) {
118                 if (only_face_normals == false) {
119                         mesh_calc_normals_vert_fallback(mverts, numVerts);
120                 }
121                 return;
122         }
123
124         /* if we are not calculating verts and no verts were passes then we have nothing to do */
125         if ((only_face_normals == true) && (r_polyNors == NULL) && (r_faceNors == NULL)) {
126                 printf("%s: called with nothing to do\n", __func__);
127                 return;
128         }
129
130         if (!pnors) pnors = MEM_calloc_arrayN((size_t)numPolys, sizeof(float[3]), __func__);
131         /* if (!fnors) fnors = MEM_calloc_arrayN(numFaces, sizeof(float[3]), "face nors mesh.c"); */ /* NO NEED TO ALLOC YET */
132
133
134         if (only_face_normals == false) {
135                 /* vertex normals are optional, they require some extra calculations,
136                  * so make them optional */
137                 BKE_mesh_calc_normals_poly(mverts, NULL, numVerts, mloop, mpolys, numLoops, numPolys, pnors, false);
138         }
139         else {
140                 /* only calc poly normals */
141                 mp = mpolys;
142                 for (i = 0; i < numPolys; i++, mp++) {
143                         BKE_mesh_calc_poly_normal(mp, mloop + mp->loopstart, mverts, pnors[i]);
144                 }
145         }
146
147         if (origIndexFace &&
148             /* fnors == r_faceNors */ /* NO NEED TO ALLOC YET */
149             fnors != NULL &&
150             numFaces)
151         {
152                 mf = mfaces;
153                 for (i = 0; i < numFaces; i++, mf++, origIndexFace++) {
154                         if (*origIndexFace < numPolys) {
155                                 copy_v3_v3(fnors[i], pnors[*origIndexFace]);
156                         }
157                         else {
158                                 /* eek, we're not corresponding to polys */
159                                 printf("error in %s: tessellation face indices are incorrect.  normals may look bad.\n", __func__);
160                         }
161                 }
162         }
163
164         if (pnors != r_polyNors) MEM_freeN(pnors);
165         /* if (fnors != r_faceNors) MEM_freeN(fnors); */ /* NO NEED TO ALLOC YET */
166
167         fnors = pnors = NULL;
168         
169 }
170
171 typedef struct MeshCalcNormalsData {
172         const MPoly *mpolys;
173         const MLoop *mloop;
174         MVert *mverts;
175         float (*pnors)[3];
176         float (*lnors_weighted)[3];
177         float (*vnors)[3];
178 } MeshCalcNormalsData;
179
180 static void mesh_calc_normals_poly_cb(
181         void *__restrict userdata, 
182         const int pidx,
183         const ParallelRangeTLS *__restrict UNUSED(tls))
184 {
185         MeshCalcNormalsData *data = userdata;
186         const MPoly *mp = &data->mpolys[pidx];
187
188         BKE_mesh_calc_poly_normal(mp, data->mloop + mp->loopstart, data->mverts, data->pnors[pidx]);
189 }
190
191 static void mesh_calc_normals_poly_prepare_cb(
192         void *__restrict userdata, 
193         const int pidx,
194         const ParallelRangeTLS *__restrict UNUSED(tls))
195 {
196         MeshCalcNormalsData *data = userdata;
197         const MPoly *mp = &data->mpolys[pidx];
198         const MLoop *ml = &data->mloop[mp->loopstart];
199         const MVert *mverts = data->mverts;
200
201         float pnor_temp[3];
202         float *pnor = data->pnors ? data->pnors[pidx] : pnor_temp;
203         float (*lnors_weighted)[3] = data->lnors_weighted;
204
205         const int nverts = mp->totloop;
206         float (*edgevecbuf)[3] = BLI_array_alloca(edgevecbuf, (size_t)nverts);
207         int i;
208
209         /* Polygon Normal and edge-vector */
210         /* inline version of #BKE_mesh_calc_poly_normal, also does edge-vectors */
211         {
212                 int i_prev = nverts - 1;
213                 const float *v_prev = mverts[ml[i_prev].v].co;
214                 const float *v_curr;
215
216                 zero_v3(pnor);
217                 /* Newell's Method */
218                 for (i = 0; i < nverts; i++) {
219                         v_curr = mverts[ml[i].v].co;
220                         add_newell_cross_v3_v3v3(pnor, v_prev, v_curr);
221
222                         /* Unrelated to normalize, calculate edge-vector */
223                         sub_v3_v3v3(edgevecbuf[i_prev], v_prev, v_curr);
224                         normalize_v3(edgevecbuf[i_prev]);
225                         i_prev = i;
226
227                         v_prev = v_curr;
228                 }
229                 if (UNLIKELY(normalize_v3(pnor) == 0.0f)) {
230                         pnor[2] = 1.0f; /* other axes set to 0.0 */
231                 }
232         }
233
234         /* accumulate angle weighted face normal */
235         /* inline version of #accumulate_vertex_normals_poly_v3,
236          * split between this threaded callback and #mesh_calc_normals_poly_accum_cb. */
237         {
238                 const float *prev_edge = edgevecbuf[nverts - 1];
239
240                 for (i = 0; i < nverts; i++) {
241                         const int lidx = mp->loopstart + i;
242                         const float *cur_edge = edgevecbuf[i];
243
244                         /* calculate angle between the two poly edges incident on
245                          * this vertex */
246                         const float fac = saacos(-dot_v3v3(cur_edge, prev_edge));
247
248                         /* Store for later accumulation */
249                         mul_v3_v3fl(lnors_weighted[lidx], pnor, fac);
250
251                         prev_edge = cur_edge;
252                 }
253         }
254 }
255
256 static void mesh_calc_normals_poly_finalize_cb(
257         void *__restrict userdata,
258         const int vidx,
259         const ParallelRangeTLS *__restrict UNUSED(tls))
260 {
261         MeshCalcNormalsData *data = userdata;
262
263         MVert *mv = &data->mverts[vidx];
264         float *no = data->vnors[vidx];
265
266         if (UNLIKELY(normalize_v3(no) == 0.0f)) {
267                 /* following Mesh convention; we use vertex coordinate itself for normal in this case */
268                 normalize_v3_v3(no, mv->co);
269         }
270
271         normal_float_to_short_v3(mv->no, no);
272 }
273
274 void BKE_mesh_calc_normals_poly(
275         MVert *mverts, float (*r_vertnors)[3], int numVerts,
276         const MLoop *mloop, const MPoly *mpolys,
277         int numLoops, int numPolys, float (*r_polynors)[3],
278         const bool only_face_normals)
279 {
280         float (*pnors)[3] = r_polynors;
281
282         ParallelRangeSettings settings;
283         BLI_parallel_range_settings_defaults(&settings);
284         settings.min_iter_per_thread = 1024;
285
286         if (only_face_normals) {
287                 BLI_assert((pnors != NULL) || (numPolys == 0));
288                 BLI_assert(r_vertnors == NULL);
289
290                 MeshCalcNormalsData data = {
291                     .mpolys = mpolys, .mloop = mloop, .mverts = mverts, .pnors = pnors,
292                 };
293
294                 BLI_task_parallel_range(0, numPolys, &data, mesh_calc_normals_poly_cb, &settings);
295                 return;
296         }
297
298         float (*vnors)[3] = r_vertnors;
299         float (*lnors_weighted)[3] = MEM_malloc_arrayN((size_t)numLoops, sizeof(*lnors_weighted), __func__);
300         bool free_vnors = false;
301
302         /* first go through and calculate normals for all the polys */
303         if (vnors == NULL) {
304                 vnors = MEM_calloc_arrayN((size_t)numVerts, sizeof(*vnors), __func__);
305                 free_vnors = true;
306         }
307         else {
308                 memset(vnors, 0, sizeof(*vnors) * (size_t)numVerts);
309         }
310
311         MeshCalcNormalsData data = {
312             .mpolys = mpolys, .mloop = mloop, .mverts = mverts,
313             .pnors = pnors, .lnors_weighted = lnors_weighted, .vnors = vnors
314         };
315
316         /* Compute poly normals, and prepare weighted loop normals. */
317         BLI_task_parallel_range(0, numPolys, &data, mesh_calc_normals_poly_prepare_cb, &settings);
318
319         /* Actually accumulate weighted loop normals into vertex ones. */
320         /* Unfortunately, not possible to thread that (not in a reasonable, totally lock- and barrier-free fashion),
321          * since several loops will point to the same vertex... */
322         for (int lidx = 0; lidx < numLoops; lidx++) {
323                 add_v3_v3(vnors[mloop[lidx].v], data.lnors_weighted[lidx]);
324         }
325
326         /* Normalize and validate computed vertex normals. */
327         BLI_task_parallel_range(0, numVerts, &data, mesh_calc_normals_poly_finalize_cb, &settings);
328
329         if (free_vnors) {
330                 MEM_freeN(vnors);
331         }
332         MEM_freeN(lnors_weighted);
333 }
334
335 void BKE_mesh_calc_normals(Mesh *mesh)
336 {
337 #ifdef DEBUG_TIME
338         TIMEIT_START_AVERAGED(BKE_mesh_calc_normals);
339 #endif
340         BKE_mesh_calc_normals_poly(mesh->mvert, NULL, mesh->totvert,
341                                    mesh->mloop, mesh->mpoly, mesh->totloop, mesh->totpoly,
342                                    NULL, false);
343 #ifdef DEBUG_TIME
344         TIMEIT_END_AVERAGED(BKE_mesh_calc_normals);
345 #endif
346 }
347
348 void BKE_mesh_calc_normals_tessface(
349         MVert *mverts, int numVerts,
350         const MFace *mfaces, int numFaces,
351         float (*r_faceNors)[3])
352 {
353         float (*tnorms)[3] = MEM_calloc_arrayN((size_t)numVerts, sizeof(*tnorms), "tnorms");
354         float (*fnors)[3] = (r_faceNors) ? r_faceNors : MEM_calloc_arrayN((size_t)numFaces, sizeof(*fnors), "meshnormals");
355         int i;
356
357         if (!tnorms || !fnors) {
358                 goto cleanup;
359         }
360
361         for (i = 0; i < numFaces; i++) {
362                 const MFace *mf = &mfaces[i];
363                 float *f_no = fnors[i];
364                 float *n4 = (mf->v4) ? tnorms[mf->v4] : NULL;
365                 const float *c4 = (mf->v4) ? mverts[mf->v4].co : NULL;
366
367                 if (mf->v4)
368                         normal_quad_v3(f_no, mverts[mf->v1].co, mverts[mf->v2].co, mverts[mf->v3].co, mverts[mf->v4].co);
369                 else
370                         normal_tri_v3(f_no, mverts[mf->v1].co, mverts[mf->v2].co, mverts[mf->v3].co);
371
372                 accumulate_vertex_normals_v3(
373                         tnorms[mf->v1], tnorms[mf->v2], tnorms[mf->v3], n4,
374                         f_no, mverts[mf->v1].co, mverts[mf->v2].co, mverts[mf->v3].co, c4);
375         }
376
377         /* following Mesh convention; we use vertex coordinate itself for normal in this case */
378         for (i = 0; i < numVerts; i++) {
379                 MVert *mv = &mverts[i];
380                 float *no = tnorms[i];
381                 
382                 if (UNLIKELY(normalize_v3(no) == 0.0f)) {
383                         normalize_v3_v3(no, mv->co);
384                 }
385
386                 normal_float_to_short_v3(mv->no, no);
387         }
388         
389 cleanup:
390         MEM_freeN(tnorms);
391
392         if (fnors != r_faceNors)
393                 MEM_freeN(fnors);
394 }
395
396 void BKE_mesh_calc_normals_looptri(
397         MVert *mverts, int numVerts,
398         const MLoop *mloop,
399         const MLoopTri *looptri, int looptri_num,
400         float (*r_tri_nors)[3])
401 {
402         float (*tnorms)[3] = MEM_calloc_arrayN((size_t)numVerts, sizeof(*tnorms), "tnorms");
403         float (*fnors)[3] = (r_tri_nors) ? r_tri_nors : MEM_calloc_arrayN((size_t)looptri_num, sizeof(*fnors), "meshnormals");
404         int i;
405
406         if (!tnorms || !fnors) {
407                 goto cleanup;
408         }
409
410         for (i = 0; i < looptri_num; i++) {
411                 const MLoopTri *lt = &looptri[i];
412                 float *f_no = fnors[i];
413                 const unsigned int vtri[3] = {
414                     mloop[lt->tri[0]].v,
415                     mloop[lt->tri[1]].v,
416                     mloop[lt->tri[2]].v,
417                 };
418
419                 normal_tri_v3(
420                         f_no,
421                         mverts[vtri[0]].co, mverts[vtri[1]].co, mverts[vtri[2]].co);
422
423                 accumulate_vertex_normals_tri_v3(
424                         tnorms[vtri[0]], tnorms[vtri[1]], tnorms[vtri[2]],
425                         f_no, mverts[vtri[0]].co, mverts[vtri[1]].co, mverts[vtri[2]].co);
426         }
427
428         /* following Mesh convention; we use vertex coordinate itself for normal in this case */
429         for (i = 0; i < numVerts; i++) {
430                 MVert *mv = &mverts[i];
431                 float *no = tnorms[i];
432
433                 if (UNLIKELY(normalize_v3(no) == 0.0f)) {
434                         normalize_v3_v3(no, mv->co);
435                 }
436
437                 normal_float_to_short_v3(mv->no, no);
438         }
439
440 cleanup:
441         MEM_freeN(tnorms);
442
443         if (fnors != r_tri_nors)
444                 MEM_freeN(fnors);
445 }
446
447 void BKE_lnor_spacearr_init(MLoopNorSpaceArray *lnors_spacearr, const int numLoops)
448 {
449         if (!(lnors_spacearr->lspacearr && lnors_spacearr->loops_pool)) {
450                 MemArena *mem;
451
452                 if (!lnors_spacearr->mem) {
453                         lnors_spacearr->mem = BLI_memarena_new(BLI_MEMARENA_STD_BUFSIZE, __func__);
454                 }
455                 mem = lnors_spacearr->mem;
456                 lnors_spacearr->lspacearr = BLI_memarena_calloc(mem, sizeof(MLoopNorSpace *) * (size_t)numLoops);
457                 lnors_spacearr->loops_pool = BLI_memarena_alloc(mem, sizeof(LinkNode) * (size_t)numLoops);
458         }
459 }
460
461 void BKE_lnor_spacearr_clear(MLoopNorSpaceArray *lnors_spacearr)
462 {
463         BLI_memarena_clear(lnors_spacearr->mem);
464         lnors_spacearr->lspacearr = NULL;
465         lnors_spacearr->loops_pool = NULL;
466 }
467
468 void BKE_lnor_spacearr_free(MLoopNorSpaceArray *lnors_spacearr)
469 {
470         BLI_memarena_free(lnors_spacearr->mem);
471         lnors_spacearr->lspacearr = NULL;
472         lnors_spacearr->loops_pool = NULL;
473         lnors_spacearr->mem = NULL;
474 }
475
476 MLoopNorSpace *BKE_lnor_space_create(MLoopNorSpaceArray *lnors_spacearr)
477 {
478         return BLI_memarena_calloc(lnors_spacearr->mem, sizeof(MLoopNorSpace));
479 }
480
481 /* This threshold is a bit touchy (usual float precision issue), this value seems OK. */
482 #define LNOR_SPACE_TRIGO_THRESHOLD (1.0f - 1e-4f)
483
484 /* Should only be called once.
485  * Beware, this modifies ref_vec and other_vec in place!
486  * In case no valid space can be generated, ref_alpha and ref_beta are set to zero (which means 'use auto lnors').
487  */
488 void BKE_lnor_space_define(MLoopNorSpace *lnor_space, const float lnor[3],
489                            float vec_ref[3], float vec_other[3], BLI_Stack *edge_vectors)
490 {
491         const float pi2 = (float)M_PI * 2.0f;
492         float tvec[3], dtp;
493         const float dtp_ref = dot_v3v3(vec_ref, lnor);
494         const float dtp_other = dot_v3v3(vec_other, lnor);
495
496         if (UNLIKELY(fabsf(dtp_ref) >= LNOR_SPACE_TRIGO_THRESHOLD || fabsf(dtp_other) >= LNOR_SPACE_TRIGO_THRESHOLD)) {
497                 /* If vec_ref or vec_other are too much aligned with lnor, we can't build lnor space,
498                  * tag it as invalid and abort. */
499                 lnor_space->ref_alpha = lnor_space->ref_beta = 0.0f;
500
501                 if (edge_vectors) {
502                         BLI_stack_clear(edge_vectors);
503                 }
504                 return;
505         }
506
507         copy_v3_v3(lnor_space->vec_lnor, lnor);
508
509         /* Compute ref alpha, average angle of all available edge vectors to lnor. */
510         if (edge_vectors) {
511                 float alpha = 0.0f;
512                 int nbr = 0;
513                 while (!BLI_stack_is_empty(edge_vectors)) {
514                         const float *vec = BLI_stack_peek(edge_vectors);
515                         alpha += saacosf(dot_v3v3(vec, lnor));
516                         BLI_stack_discard(edge_vectors);
517                         nbr++;
518                 }
519                 /* Note: In theory, this could be 'nbr > 2', but there is one case where we only have two edges for
520                  *       two loops: a smooth vertex with only two edges and two faces (our Monkey's nose has that, e.g.). */
521                 BLI_assert(nbr >= 2);  /* This piece of code shall only be called for more than one loop... */
522                 lnor_space->ref_alpha = alpha / (float)nbr;
523         }
524         else {
525                 lnor_space->ref_alpha = (saacosf(dot_v3v3(vec_ref, lnor)) + saacosf(dot_v3v3(vec_other, lnor))) / 2.0f;
526         }
527
528         /* Project vec_ref on lnor's ortho plane. */
529         mul_v3_v3fl(tvec, lnor, dtp_ref);
530         sub_v3_v3(vec_ref, tvec);
531         normalize_v3_v3(lnor_space->vec_ref, vec_ref);
532
533         cross_v3_v3v3(tvec, lnor, lnor_space->vec_ref);
534         normalize_v3_v3(lnor_space->vec_ortho, tvec);
535
536         /* Project vec_other on lnor's ortho plane. */
537         mul_v3_v3fl(tvec, lnor, dtp_other);
538         sub_v3_v3(vec_other, tvec);
539         normalize_v3(vec_other);
540
541         /* Beta is angle between ref_vec and other_vec, around lnor. */
542         dtp = dot_v3v3(lnor_space->vec_ref, vec_other);
543         if (LIKELY(dtp < LNOR_SPACE_TRIGO_THRESHOLD)) {
544                 const float beta = saacos(dtp);
545                 lnor_space->ref_beta = (dot_v3v3(lnor_space->vec_ortho, vec_other) < 0.0f) ? pi2 - beta : beta;
546         }
547         else {
548                 lnor_space->ref_beta = pi2;
549         }
550 }
551
552 void BKE_lnor_space_add_loop(MLoopNorSpaceArray *lnors_spacearr, MLoopNorSpace *lnor_space, const int ml_index,
553                              const bool do_add_loop)
554 {
555         lnors_spacearr->lspacearr[ml_index] = lnor_space;
556         if (do_add_loop) {
557                 BLI_linklist_prepend_nlink(&lnor_space->loops, SET_INT_IN_POINTER(ml_index), &lnors_spacearr->loops_pool[ml_index]);
558         }
559 }
560
561 MINLINE float unit_short_to_float(const short val)
562 {
563         return (float)val / (float)SHRT_MAX;
564 }
565
566 MINLINE short unit_float_to_short(const float val)
567 {
568         /* Rounding... */
569         return (short)floorf(val * (float)SHRT_MAX + 0.5f);
570 }
571
572 void BKE_lnor_space_custom_data_to_normal(MLoopNorSpace *lnor_space, const short clnor_data[2], float r_custom_lnor[3])
573 {
574         /* NOP custom normal data or invalid lnor space, return. */
575         if (clnor_data[0] == 0 || lnor_space->ref_alpha == 0.0f || lnor_space->ref_beta == 0.0f) {
576                 copy_v3_v3(r_custom_lnor, lnor_space->vec_lnor);
577                 return;
578         }
579
580         {
581                 /* TODO Check whether using sincosf() gives any noticeable benefit
582                  *      (could not even get it working under linux though)! */
583                 const float pi2 = (float)(M_PI * 2.0);
584                 const float alphafac = unit_short_to_float(clnor_data[0]);
585                 const float alpha = (alphafac > 0.0f ? lnor_space->ref_alpha : pi2 - lnor_space->ref_alpha) * alphafac;
586                 const float betafac = unit_short_to_float(clnor_data[1]);
587
588                 mul_v3_v3fl(r_custom_lnor, lnor_space->vec_lnor, cosf(alpha));
589
590                 if (betafac == 0.0f) {
591                         madd_v3_v3fl(r_custom_lnor, lnor_space->vec_ref, sinf(alpha));
592                 }
593                 else {
594                         const float sinalpha = sinf(alpha);
595                         const float beta = (betafac > 0.0f ? lnor_space->ref_beta : pi2 - lnor_space->ref_beta) * betafac;
596                         madd_v3_v3fl(r_custom_lnor, lnor_space->vec_ref, sinalpha * cosf(beta));
597                         madd_v3_v3fl(r_custom_lnor, lnor_space->vec_ortho, sinalpha * sinf(beta));
598                 }
599         }
600 }
601
602 void BKE_lnor_space_custom_normal_to_data(MLoopNorSpace *lnor_space, const float custom_lnor[3], short r_clnor_data[2])
603 {
604         /* We use null vector as NOP custom normal (can be simpler than giving autocomputed lnor...). */
605         if (is_zero_v3(custom_lnor) || compare_v3v3(lnor_space->vec_lnor, custom_lnor, 1e-4f)) {
606                 r_clnor_data[0] = r_clnor_data[1] = 0;
607                 return;
608         }
609
610         {
611                 const float pi2 = (float)(M_PI * 2.0);
612                 const float cos_alpha = dot_v3v3(lnor_space->vec_lnor, custom_lnor);
613                 float vec[3], cos_beta;
614                 float alpha;
615
616                 alpha = saacosf(cos_alpha);
617                 if (alpha > lnor_space->ref_alpha) {
618                         /* Note we could stick to [0, pi] range here, but makes decoding more complex, not worth it. */
619                         r_clnor_data[0] = unit_float_to_short(-(pi2 - alpha) / (pi2 - lnor_space->ref_alpha));
620                 }
621                 else {
622                         r_clnor_data[0] = unit_float_to_short(alpha / lnor_space->ref_alpha);
623                 }
624
625                 /* Project custom lnor on (vec_ref, vec_ortho) plane. */
626                 mul_v3_v3fl(vec, lnor_space->vec_lnor, -cos_alpha);
627                 add_v3_v3(vec, custom_lnor);
628                 normalize_v3(vec);
629
630                 cos_beta = dot_v3v3(lnor_space->vec_ref, vec);
631
632                 if (cos_beta < LNOR_SPACE_TRIGO_THRESHOLD) {
633                         float beta = saacosf(cos_beta);
634                         if (dot_v3v3(lnor_space->vec_ortho, vec) < 0.0f) {
635                                 beta = pi2 - beta;
636                         }
637
638                         if (beta > lnor_space->ref_beta) {
639                                 r_clnor_data[1] = unit_float_to_short(-(pi2 - beta) / (pi2 - lnor_space->ref_beta));
640                         }
641                         else {
642                                 r_clnor_data[1] = unit_float_to_short(beta / lnor_space->ref_beta);
643                         }
644                 }
645                 else {
646                         r_clnor_data[1] = 0;
647                 }
648         }
649 }
650
651 #define LOOP_SPLIT_TASK_BLOCK_SIZE 1024
652
653 typedef struct LoopSplitTaskData {
654         /* Specific to each instance (each task). */
655         MLoopNorSpace *lnor_space;  /* We have to create those outside of tasks, since afaik memarena is not threadsafe. */
656         float (*lnor)[3];
657         const MLoop *ml_curr;
658         const MLoop *ml_prev;
659         int ml_curr_index;
660         int ml_prev_index;
661         const int *e2l_prev;  /* Also used a flag to switch between single or fan process! */
662         int mp_index;
663
664         /* This one is special, it's owned and managed by worker tasks, avoid to have to create it for each fan! */
665         BLI_Stack *edge_vectors;
666
667         char pad_c;
668 } LoopSplitTaskData;
669
670 typedef struct LoopSplitTaskDataCommon {
671         /* Read/write.
672          * Note we do not need to protect it, though, since two different tasks will *always* affect different
673          * elements in the arrays. */
674         MLoopNorSpaceArray *lnors_spacearr;
675         float (*loopnors)[3];
676         short (*clnors_data)[2];
677
678         /* Read-only. */
679         const MVert *mverts;
680         const MEdge *medges;
681         const MLoop *mloops;
682         const MPoly *mpolys;
683         int (*edge_to_loops)[2];
684         int *loop_to_poly;
685         const float (*polynors)[3];
686
687         int numEdges;
688         int numLoops;
689         int numPolys;
690 } LoopSplitTaskDataCommon;
691
692 #define INDEX_UNSET INT_MIN
693 #define INDEX_INVALID -1
694 /* See comment about edge_to_loops below. */
695 #define IS_EDGE_SHARP(_e2l) (ELEM((_e2l)[1], INDEX_UNSET, INDEX_INVALID))
696
697 static void mesh_edges_sharp_tag(
698         LoopSplitTaskDataCommon *data,
699         const bool check_angle, const float split_angle, const bool do_sharp_edges_tag)
700 {
701         const MVert *mverts = data->mverts;
702         const MEdge *medges = data->medges;
703         const MLoop *mloops = data->mloops;
704
705         const MPoly *mpolys = data->mpolys;
706
707         const int numEdges = data->numEdges;
708         const int numPolys = data->numPolys;
709
710         float (*loopnors)[3] = data->loopnors;  /* Note: loopnors may be NULL here. */
711         const float (*polynors)[3] = data->polynors;
712
713         int (*edge_to_loops)[2] = data->edge_to_loops;
714         int *loop_to_poly = data->loop_to_poly;
715
716         BLI_bitmap *sharp_edges = do_sharp_edges_tag ? BLI_BITMAP_NEW(numEdges, __func__) : NULL;
717
718         const MPoly *mp;
719         int mp_index;
720
721         const float split_angle_cos = check_angle ? cosf(split_angle) : -1.0f;
722
723         for (mp = mpolys, mp_index = 0; mp_index < numPolys; mp++, mp_index++) {
724                 const MLoop *ml_curr;
725                 int *e2l;
726                 int ml_curr_index = mp->loopstart;
727                 const int ml_last_index = (ml_curr_index + mp->totloop) - 1;
728
729                 ml_curr = &mloops[ml_curr_index];
730
731                 for (; ml_curr_index <= ml_last_index; ml_curr++, ml_curr_index++) {
732                         e2l = edge_to_loops[ml_curr->e];
733
734                         loop_to_poly[ml_curr_index] = mp_index;
735
736                         /* Pre-populate all loop normals as if their verts were all-smooth, this way we don't have to compute
737                          * those later!
738                          */
739                         if (loopnors) {
740                                 normal_short_to_float_v3(loopnors[ml_curr_index], mverts[ml_curr->v].no);
741                         }
742
743                         /* Check whether current edge might be smooth or sharp */
744                         if ((e2l[0] | e2l[1]) == 0) {
745                                 /* 'Empty' edge until now, set e2l[0] (and e2l[1] to INDEX_UNSET to tag it as unset). */
746                                 e2l[0] = ml_curr_index;
747                                 /* We have to check this here too, else we might miss some flat faces!!! */
748                                 e2l[1] = (mp->flag & ME_SMOOTH) ? INDEX_UNSET : INDEX_INVALID;
749                         }
750                         else if (e2l[1] == INDEX_UNSET) {
751                                 const bool is_angle_sharp = (check_angle &&
752                                                              dot_v3v3(polynors[loop_to_poly[e2l[0]]], polynors[mp_index]) < split_angle_cos);
753
754                                 /* Second loop using this edge, time to test its sharpness.
755                                  * An edge is sharp if it is tagged as such, or its face is not smooth,
756                                  * or both poly have opposed (flipped) normals, i.e. both loops on the same edge share the same vertex,
757                                  * or angle between both its polys' normals is above split_angle value.
758                                  */
759                                 if (!(mp->flag & ME_SMOOTH) || (medges[ml_curr->e].flag & ME_SHARP) ||
760                                     ml_curr->v == mloops[e2l[0]].v ||
761                                     is_angle_sharp)
762                                 {
763                                         /* Note: we are sure that loop != 0 here ;) */
764                                         e2l[1] = INDEX_INVALID;
765
766                                         /* We want to avoid tagging edges as sharp when it is already defined as such by
767                                          * other causes than angle threshold... */
768                                         if (do_sharp_edges_tag && is_angle_sharp) {
769                                                 BLI_BITMAP_SET(sharp_edges, ml_curr->e, true);
770                                         }
771                                 }
772                                 else {
773                                         e2l[1] = ml_curr_index;
774                                 }
775                         }
776                         else if (!IS_EDGE_SHARP(e2l)) {
777                                 /* More than two loops using this edge, tag as sharp if not yet done. */
778                                 e2l[1] = INDEX_INVALID;
779
780                                 /* We want to avoid tagging edges as sharp when it is already defined as such by
781                                  * other causes than angle threshold... */
782                                 if (do_sharp_edges_tag) {
783                                         BLI_BITMAP_SET(sharp_edges, ml_curr->e, false);
784                                 }
785                         }
786                         /* Else, edge is already 'disqualified' (i.e. sharp)! */
787                 }
788         }
789
790         /* If requested, do actual tagging of edges as sharp in another loop. */
791         if (do_sharp_edges_tag) {
792                 MEdge *me;
793                 int me_index;
794                 for (me = (MEdge *)medges, me_index = 0; me_index < numEdges; me++, me_index++) {
795                         if (BLI_BITMAP_TEST(sharp_edges, me_index)) {
796                                 me->flag |= ME_SHARP;
797                         }
798                 }
799
800                 MEM_freeN(sharp_edges);
801         }
802 }
803
804 /** Define sharp edges as needed to mimic 'autosmooth' from angle threshold.
805  *
806  * Used when defining an empty custom loop normals data layer, to keep same shading as with autosmooth!
807  */
808 void BKE_edges_sharp_from_angle_set(
809         const struct MVert *mverts, const int UNUSED(numVerts),
810         struct MEdge *medges, const int numEdges,
811         struct MLoop *mloops, const int numLoops,
812         struct MPoly *mpolys, const float (*polynors)[3], const int numPolys,
813         const float split_angle)
814 {
815         if (split_angle >= (float)M_PI) {
816                 /* Nothing to do! */
817                 return;
818         }
819
820         /* Mapping edge -> loops. See BKE_mesh_normals_loop_split() for details. */
821         int (*edge_to_loops)[2] = MEM_calloc_arrayN((size_t)numEdges, sizeof(*edge_to_loops), __func__);
822
823         /* Simple mapping from a loop to its polygon index. */
824         int *loop_to_poly = MEM_malloc_arrayN((size_t)numLoops, sizeof(*loop_to_poly), __func__);
825
826         LoopSplitTaskDataCommon common_data = {
827             .mverts = mverts,
828             .medges = medges,
829             .mloops = mloops,
830             .mpolys = mpolys,
831             .edge_to_loops = edge_to_loops,
832             .loop_to_poly = loop_to_poly,
833             .polynors = polynors,
834             .numEdges = numEdges,
835             .numPolys = numPolys,
836         };
837
838         mesh_edges_sharp_tag(&common_data, true, split_angle, true);
839
840         MEM_freeN(edge_to_loops);
841         MEM_freeN(loop_to_poly);
842 }
843
844 static void loop_manifold_fan_around_vert_next(
845         const MLoop *mloops, const MPoly *mpolys,
846         const int *loop_to_poly, const int *e2lfan_curr, const uint mv_pivot_index,
847         const MLoop **r_mlfan_curr, int *r_mlfan_curr_index, int *r_mlfan_vert_index, int *r_mpfan_curr_index)
848 {
849         const MLoop *mlfan_next;
850         const MPoly *mpfan_next;
851
852         /* Warning! This is rather complex!
853          * We have to find our next edge around the vertex (fan mode).
854          * First we find the next loop, which is either previous or next to mlfan_curr_index, depending
855          * whether both loops using current edge are in the same direction or not, and whether
856          * mlfan_curr_index actually uses the vertex we are fanning around!
857          * mlfan_curr_index is the index of mlfan_next here, and mlfan_next is not the real next one
858          * (i.e. not the future mlfan_curr)...
859          */
860         *r_mlfan_curr_index = (e2lfan_curr[0] == *r_mlfan_curr_index) ? e2lfan_curr[1] : e2lfan_curr[0];
861         *r_mpfan_curr_index = loop_to_poly[*r_mlfan_curr_index];
862
863         BLI_assert(*r_mlfan_curr_index >= 0);
864         BLI_assert(*r_mpfan_curr_index >= 0);
865
866         mlfan_next = &mloops[*r_mlfan_curr_index];
867         mpfan_next = &mpolys[*r_mpfan_curr_index];
868         if (((*r_mlfan_curr)->v == mlfan_next->v && (*r_mlfan_curr)->v == mv_pivot_index) ||
869             ((*r_mlfan_curr)->v != mlfan_next->v && (*r_mlfan_curr)->v != mv_pivot_index))
870         {
871                 /* We need the previous loop, but current one is our vertex's loop. */
872                 *r_mlfan_vert_index = *r_mlfan_curr_index;
873                 if (--(*r_mlfan_curr_index) < mpfan_next->loopstart) {
874                         *r_mlfan_curr_index = mpfan_next->loopstart + mpfan_next->totloop - 1;
875                 }
876         }
877         else {
878                 /* We need the next loop, which is also our vertex's loop. */
879                 if (++(*r_mlfan_curr_index) >= mpfan_next->loopstart + mpfan_next->totloop) {
880                         *r_mlfan_curr_index = mpfan_next->loopstart;
881                 }
882                 *r_mlfan_vert_index = *r_mlfan_curr_index;
883         }
884         *r_mlfan_curr = &mloops[*r_mlfan_curr_index];
885         /* And now we are back in sync, mlfan_curr_index is the index of mlfan_curr! Pff! */
886 }
887
888 static void split_loop_nor_single_do(LoopSplitTaskDataCommon *common_data, LoopSplitTaskData *data)
889 {
890         MLoopNorSpaceArray *lnors_spacearr = common_data->lnors_spacearr;
891         short (*clnors_data)[2] = common_data->clnors_data;
892
893         const MVert *mverts = common_data->mverts;
894         const MEdge *medges = common_data->medges;
895         const float (*polynors)[3] = common_data->polynors;
896
897         MLoopNorSpace *lnor_space = data->lnor_space;
898         float (*lnor)[3] = data->lnor;
899         const MLoop *ml_curr = data->ml_curr;
900         const MLoop *ml_prev = data->ml_prev;
901         const int ml_curr_index = data->ml_curr_index;
902 #if 0  /* Not needed for 'single' loop. */
903         const int ml_prev_index = data->ml_prev_index;
904         const int *e2l_prev = data->e2l_prev;
905 #endif
906         const int mp_index = data->mp_index;
907
908         /* Simple case (both edges around that vertex are sharp in current polygon),
909          * this loop just takes its poly normal.
910          */
911         copy_v3_v3(*lnor, polynors[mp_index]);
912
913 //      printf("BASIC: handling loop %d / edge %d / vert %d / poly %d\n", ml_curr_index, ml_curr->e, ml_curr->v, mp_index);
914
915         /* If needed, generate this (simple!) lnor space. */
916         if (lnors_spacearr) {
917                 float vec_curr[3], vec_prev[3];
918
919                 const unsigned int mv_pivot_index = ml_curr->v;  /* The vertex we are "fanning" around! */
920                 const MVert *mv_pivot = &mverts[mv_pivot_index];
921                 const MEdge *me_curr = &medges[ml_curr->e];
922                 const MVert *mv_2 = (me_curr->v1 == mv_pivot_index) ? &mverts[me_curr->v2] : &mverts[me_curr->v1];
923                 const MEdge *me_prev = &medges[ml_prev->e];
924                 const MVert *mv_3 = (me_prev->v1 == mv_pivot_index) ? &mverts[me_prev->v2] : &mverts[me_prev->v1];
925
926                 sub_v3_v3v3(vec_curr, mv_2->co, mv_pivot->co);
927                 normalize_v3(vec_curr);
928                 sub_v3_v3v3(vec_prev, mv_3->co, mv_pivot->co);
929                 normalize_v3(vec_prev);
930
931                 BKE_lnor_space_define(lnor_space, *lnor, vec_curr, vec_prev, NULL);
932                 /* We know there is only one loop in this space, no need to create a linklist in this case... */
933                 BKE_lnor_space_add_loop(lnors_spacearr, lnor_space, ml_curr_index, false);
934
935                 if (clnors_data) {
936                         BKE_lnor_space_custom_data_to_normal(lnor_space, clnors_data[ml_curr_index], *lnor);
937                 }
938         }
939 }
940
941 static void split_loop_nor_fan_do(LoopSplitTaskDataCommon *common_data, LoopSplitTaskData *data)
942 {
943         MLoopNorSpaceArray *lnors_spacearr = common_data->lnors_spacearr;
944         float (*loopnors)[3] = common_data->loopnors;
945         short (*clnors_data)[2] = common_data->clnors_data;
946
947         const MVert *mverts = common_data->mverts;
948         const MEdge *medges = common_data->medges;
949         const MLoop *mloops = common_data->mloops;
950         const MPoly *mpolys = common_data->mpolys;
951         const int (*edge_to_loops)[2] = common_data->edge_to_loops;
952         const int *loop_to_poly = common_data->loop_to_poly;
953         const float (*polynors)[3] = common_data->polynors;
954
955         MLoopNorSpace *lnor_space = data->lnor_space;
956 #if 0  /* Not needed for 'fan' loops. */
957         float (*lnor)[3] = data->lnor;
958 #endif
959         const MLoop *ml_curr = data->ml_curr;
960         const MLoop *ml_prev = data->ml_prev;
961         const int ml_curr_index = data->ml_curr_index;
962         const int ml_prev_index = data->ml_prev_index;
963         const int mp_index = data->mp_index;
964         const int *e2l_prev = data->e2l_prev;
965
966         BLI_Stack *edge_vectors = data->edge_vectors;
967
968         /* Gah... We have to fan around current vertex, until we find the other non-smooth edge,
969          * and accumulate face normals into the vertex!
970          * Note in case this vertex has only one sharp edges, this is a waste because the normal is the same as
971          * the vertex normal, but I do not see any easy way to detect that (would need to count number
972          * of sharp edges per vertex, I doubt the additional memory usage would be worth it, especially as
973          * it should not be a common case in real-life meshes anyway).
974          */
975         const unsigned int mv_pivot_index = ml_curr->v;  /* The vertex we are "fanning" around! */
976         const MVert *mv_pivot = &mverts[mv_pivot_index];
977         const MEdge *me_org = &medges[ml_curr->e];  /* ml_curr would be mlfan_prev if we needed that one */
978         const int *e2lfan_curr;
979         float vec_curr[3], vec_prev[3], vec_org[3];
980         const MLoop *mlfan_curr;
981         float lnor[3] = {0.0f, 0.0f, 0.0f};
982         /* mlfan_vert_index: the loop of our current edge might not be the loop of our current vertex! */
983         int mlfan_curr_index, mlfan_vert_index, mpfan_curr_index;
984
985         /* We validate clnors data on the fly - cheapest way to do! */
986         int clnors_avg[2] = {0, 0};
987         short (*clnor_ref)[2] = NULL;
988         int clnors_nbr = 0;
989         bool clnors_invalid = false;
990
991         /* Temp loop normal stack. */
992         BLI_SMALLSTACK_DECLARE(normal, float *);
993         /* Temp clnors stack. */
994         BLI_SMALLSTACK_DECLARE(clnors, short *);
995
996         e2lfan_curr = e2l_prev;
997         mlfan_curr = ml_prev;
998         mlfan_curr_index = ml_prev_index;
999         mlfan_vert_index = ml_curr_index;
1000         mpfan_curr_index = mp_index;
1001
1002         BLI_assert(mlfan_curr_index >= 0);
1003         BLI_assert(mlfan_vert_index >= 0);
1004         BLI_assert(mpfan_curr_index >= 0);
1005
1006         /* Only need to compute previous edge's vector once, then we can just reuse old current one! */
1007         {
1008                 const MVert *mv_2 = (me_org->v1 == mv_pivot_index) ? &mverts[me_org->v2] : &mverts[me_org->v1];
1009
1010                 sub_v3_v3v3(vec_org, mv_2->co, mv_pivot->co);
1011                 normalize_v3(vec_org);
1012                 copy_v3_v3(vec_prev, vec_org);
1013
1014                 if (lnors_spacearr) {
1015                         BLI_stack_push(edge_vectors, vec_org);
1016                 }
1017         }
1018
1019 //      printf("FAN: vert %d, start edge %d\n", mv_pivot_index, ml_curr->e);
1020
1021         while (true) {
1022                 const MEdge *me_curr = &medges[mlfan_curr->e];
1023                 /* Compute edge vectors.
1024                  * NOTE: We could pre-compute those into an array, in the first iteration, instead of computing them
1025                  *       twice (or more) here. However, time gained is not worth memory and time lost,
1026                  *       given the fact that this code should not be called that much in real-life meshes...
1027                  */
1028                 {
1029                         const MVert *mv_2 = (me_curr->v1 == mv_pivot_index) ? &mverts[me_curr->v2] : &mverts[me_curr->v1];
1030
1031                         sub_v3_v3v3(vec_curr, mv_2->co, mv_pivot->co);
1032                         normalize_v3(vec_curr);
1033                 }
1034
1035 //              printf("\thandling edge %d / loop %d\n", mlfan_curr->e, mlfan_curr_index);
1036
1037                 {
1038                         /* Code similar to accumulate_vertex_normals_poly_v3. */
1039                         /* Calculate angle between the two poly edges incident on this vertex. */
1040                         const float fac = saacos(dot_v3v3(vec_curr, vec_prev));
1041                         /* Accumulate */
1042                         madd_v3_v3fl(lnor, polynors[mpfan_curr_index], fac);
1043
1044                         if (clnors_data) {
1045                                 /* Accumulate all clnors, if they are not all equal we have to fix that! */
1046                                 short (*clnor)[2] = &clnors_data[mlfan_vert_index];
1047                                 if (clnors_nbr) {
1048                                         clnors_invalid |= ((*clnor_ref)[0] != (*clnor)[0] || (*clnor_ref)[1] != (*clnor)[1]);
1049                                 }
1050                                 else {
1051                                         clnor_ref = clnor;
1052                                 }
1053                                 clnors_avg[0] += (*clnor)[0];
1054                                 clnors_avg[1] += (*clnor)[1];
1055                                 clnors_nbr++;
1056                                 /* We store here a pointer to all custom lnors processed. */
1057                                 BLI_SMALLSTACK_PUSH(clnors, (short *)*clnor);
1058                         }
1059                 }
1060
1061                 /* We store here a pointer to all loop-normals processed. */
1062                 BLI_SMALLSTACK_PUSH(normal, (float *)(loopnors[mlfan_vert_index]));
1063
1064                 if (lnors_spacearr) {
1065                         /* Assign current lnor space to current 'vertex' loop. */
1066                         BKE_lnor_space_add_loop(lnors_spacearr, lnor_space, mlfan_vert_index, true);
1067                         if (me_curr != me_org) {
1068                                 /* We store here all edges-normalized vectors processed. */
1069                                 BLI_stack_push(edge_vectors, vec_curr);
1070                         }
1071                 }
1072
1073                 if (IS_EDGE_SHARP(e2lfan_curr) || (me_curr == me_org)) {
1074                         /* Current edge is sharp and we have finished with this fan of faces around this vert,
1075                          * or this vert is smooth, and we have completed a full turn around it.
1076                          */
1077 //                      printf("FAN: Finished!\n");
1078                         break;
1079                 }
1080
1081                 copy_v3_v3(vec_prev, vec_curr);
1082
1083                 /* Find next loop of the smooth fan. */
1084                 loop_manifold_fan_around_vert_next(
1085                             mloops, mpolys, loop_to_poly, e2lfan_curr, mv_pivot_index,
1086                             &mlfan_curr, &mlfan_curr_index, &mlfan_vert_index, &mpfan_curr_index);
1087
1088                 e2lfan_curr = edge_to_loops[mlfan_curr->e];
1089         }
1090
1091         {
1092                 float lnor_len = normalize_v3(lnor);
1093
1094                 /* If we are generating lnor spacearr, we can now define the one for this fan,
1095                  * and optionally compute final lnor from custom data too!
1096                  */
1097                 if (lnors_spacearr) {
1098                         if (UNLIKELY(lnor_len == 0.0f)) {
1099                                 /* Use vertex normal as fallback! */
1100                                 copy_v3_v3(lnor, loopnors[mlfan_vert_index]);
1101                                 lnor_len = 1.0f;
1102                         }
1103
1104                         BKE_lnor_space_define(lnor_space, lnor, vec_org, vec_curr, edge_vectors);
1105
1106                         if (clnors_data) {
1107                                 if (clnors_invalid) {
1108                                         short *clnor;
1109
1110                                         clnors_avg[0] /= clnors_nbr;
1111                                         clnors_avg[1] /= clnors_nbr;
1112                                         /* Fix/update all clnors of this fan with computed average value. */
1113                                         if (G.debug & G_DEBUG) {
1114                                                 printf("Invalid clnors in this fan!\n");
1115                                         }
1116                                         while ((clnor = BLI_SMALLSTACK_POP(clnors))) {
1117                                                 //print_v2("org clnor", clnor);
1118                                                 clnor[0] = (short)clnors_avg[0];
1119                                                 clnor[1] = (short)clnors_avg[1];
1120                                         }
1121                                         //print_v2("new clnors", clnors_avg);
1122                                 }
1123                                 /* Extra bonus: since smallstack is local to this func, no more need to empty it at all cost! */
1124
1125                                 BKE_lnor_space_custom_data_to_normal(lnor_space, *clnor_ref, lnor);
1126                         }
1127                 }
1128
1129                 /* In case we get a zero normal here, just use vertex normal already set! */
1130                 if (LIKELY(lnor_len != 0.0f)) {
1131                         /* Copy back the final computed normal into all related loop-normals. */
1132                         float *nor;
1133
1134                         while ((nor = BLI_SMALLSTACK_POP(normal))) {
1135                                 copy_v3_v3(nor, lnor);
1136                         }
1137                 }
1138                 /* Extra bonus: since smallstack is local to this func, no more need to empty it at all cost! */
1139         }
1140 }
1141
1142 static void loop_split_worker_do(
1143         LoopSplitTaskDataCommon *common_data, LoopSplitTaskData *data, BLI_Stack *edge_vectors)
1144 {
1145         BLI_assert(data->ml_curr);
1146         if (data->e2l_prev) {
1147                 BLI_assert((edge_vectors == NULL) || BLI_stack_is_empty(edge_vectors));
1148                 data->edge_vectors = edge_vectors;
1149                 split_loop_nor_fan_do(common_data, data);
1150         }
1151         else {
1152                 /* No need for edge_vectors for 'single' case! */
1153                 split_loop_nor_single_do(common_data, data);
1154         }
1155 }
1156
1157 static void loop_split_worker(TaskPool * __restrict pool, void *taskdata, int UNUSED(threadid))
1158 {
1159         LoopSplitTaskDataCommon *common_data = BLI_task_pool_userdata(pool);
1160         LoopSplitTaskData *data = taskdata;
1161
1162         /* Temp edge vectors stack, only used when computing lnor spacearr. */
1163         BLI_Stack *edge_vectors = common_data->lnors_spacearr ? BLI_stack_new(sizeof(float[3]), __func__) : NULL;
1164
1165 #ifdef DEBUG_TIME
1166         TIMEIT_START_AVERAGED(loop_split_worker);
1167 #endif
1168
1169         for (int i = 0; i < LOOP_SPLIT_TASK_BLOCK_SIZE; i++, data++) {
1170                 /* A NULL ml_curr is used to tag ended data! */
1171                 if (data->ml_curr == NULL) {
1172                         break;
1173                 }
1174
1175                 loop_split_worker_do(common_data, data, edge_vectors);
1176         }
1177
1178         if (edge_vectors) {
1179                 BLI_stack_free(edge_vectors);
1180         }
1181
1182 #ifdef DEBUG_TIME
1183         TIMEIT_END_AVERAGED(loop_split_worker);
1184 #endif
1185 }
1186
1187 /* Check whether gievn loop is part of an unknown-so-far cyclic smooth fan, or not.
1188  * Needed because cyclic smooth fans have no obvious 'entry point', and yet we need to walk them once, and only once. */
1189 static bool loop_split_generator_check_cyclic_smooth_fan(
1190         const MLoop *mloops, const MPoly *mpolys,
1191         const int (*edge_to_loops)[2], const int *loop_to_poly, const int *e2l_prev, BLI_bitmap *skip_loops,
1192         const MLoop *ml_curr, const MLoop *ml_prev, const int ml_curr_index, const int ml_prev_index,
1193         const int mp_curr_index)
1194 {
1195         const unsigned int mv_pivot_index = ml_curr->v;  /* The vertex we are "fanning" around! */
1196         const int *e2lfan_curr;
1197         const MLoop *mlfan_curr;
1198         /* mlfan_vert_index: the loop of our current edge might not be the loop of our current vertex! */
1199         int mlfan_curr_index, mlfan_vert_index, mpfan_curr_index;
1200
1201         e2lfan_curr = e2l_prev;
1202         if (IS_EDGE_SHARP(e2lfan_curr)) {
1203                 /* Sharp loop, so not a cyclic smooth fan... */
1204                 return false;
1205         }
1206
1207         mlfan_curr = ml_prev;
1208         mlfan_curr_index = ml_prev_index;
1209         mlfan_vert_index = ml_curr_index;
1210         mpfan_curr_index = mp_curr_index;
1211
1212         BLI_assert(mlfan_curr_index >= 0);
1213         BLI_assert(mlfan_vert_index >= 0);
1214         BLI_assert(mpfan_curr_index >= 0);
1215
1216         BLI_assert(!BLI_BITMAP_TEST(skip_loops, mlfan_vert_index));
1217         BLI_BITMAP_ENABLE(skip_loops, mlfan_vert_index);
1218
1219         while (true) {
1220                 /* Find next loop of the smooth fan. */
1221                 loop_manifold_fan_around_vert_next(
1222                             mloops, mpolys, loop_to_poly, e2lfan_curr, mv_pivot_index,
1223                             &mlfan_curr, &mlfan_curr_index, &mlfan_vert_index, &mpfan_curr_index);
1224
1225                 e2lfan_curr = edge_to_loops[mlfan_curr->e];
1226
1227                 if (IS_EDGE_SHARP(e2lfan_curr)) {
1228                         /* Sharp loop/edge, so not a cyclic smooth fan... */
1229                         return false;
1230                 }
1231                 /* Smooth loop/edge... */
1232                 else if (BLI_BITMAP_TEST(skip_loops, mlfan_vert_index)) {
1233                         if (mlfan_vert_index == ml_curr_index) {
1234                                 /* We walked around a whole cyclic smooth fan without finding any already-processed loop, means we can
1235                                  * use initial ml_curr/ml_prev edge as start for this smooth fan. */
1236                                 return true;
1237                         }
1238                         /* ... already checked in some previous looping, we can abort. */
1239                         return false;
1240                 }
1241                 else {
1242                         /* ... we can skip it in future, and keep checking the smooth fan. */
1243                         BLI_BITMAP_ENABLE(skip_loops, mlfan_vert_index);
1244                 }
1245         }
1246 }
1247
1248 static void loop_split_generator(TaskPool *pool, LoopSplitTaskDataCommon *common_data)
1249 {
1250         MLoopNorSpaceArray *lnors_spacearr = common_data->lnors_spacearr;
1251         float (*loopnors)[3] = common_data->loopnors;
1252
1253         const MLoop *mloops = common_data->mloops;
1254         const MPoly *mpolys = common_data->mpolys;
1255         const int *loop_to_poly = common_data->loop_to_poly;
1256         const int (*edge_to_loops)[2] = common_data->edge_to_loops;
1257         const int numLoops = common_data->numLoops;
1258         const int numPolys = common_data->numPolys;
1259
1260         const MPoly *mp;
1261         int mp_index;
1262
1263         const MLoop *ml_curr;
1264         const MLoop *ml_prev;
1265         int ml_curr_index;
1266         int ml_prev_index;
1267
1268         BLI_bitmap *skip_loops = BLI_BITMAP_NEW(numLoops, __func__);
1269
1270         LoopSplitTaskData *data_buff = NULL;
1271         int data_idx = 0;
1272
1273         /* Temp edge vectors stack, only used when computing lnor spacearr (and we are not multi-threading). */
1274         BLI_Stack *edge_vectors = NULL;
1275
1276 #ifdef DEBUG_TIME
1277         TIMEIT_START_AVERAGED(loop_split_generator);
1278 #endif
1279
1280         if (!pool) {
1281                 if (lnors_spacearr) {
1282                         edge_vectors = BLI_stack_new(sizeof(float[3]), __func__);
1283                 }
1284         }
1285
1286         /* We now know edges that can be smoothed (with their vector, and their two loops), and edges that will be hard!
1287          * Now, time to generate the normals.
1288          */
1289         for (mp = mpolys, mp_index = 0; mp_index < numPolys; mp++, mp_index++) {
1290                 float (*lnors)[3];
1291                 const int ml_last_index = (mp->loopstart + mp->totloop) - 1;
1292                 ml_curr_index = mp->loopstart;
1293                 ml_prev_index = ml_last_index;
1294
1295                 ml_curr = &mloops[ml_curr_index];
1296                 ml_prev = &mloops[ml_prev_index];
1297                 lnors = &loopnors[ml_curr_index];
1298
1299                 for (; ml_curr_index <= ml_last_index; ml_curr++, ml_curr_index++, lnors++) {
1300                         const int *e2l_curr = edge_to_loops[ml_curr->e];
1301                         const int *e2l_prev = edge_to_loops[ml_prev->e];
1302
1303 //                      printf("Checking loop %d / edge %u / vert %u (sharp edge: %d, skiploop: %d)...",
1304 //                             ml_curr_index, ml_curr->e, ml_curr->v, IS_EDGE_SHARP(e2l_curr), BLI_BITMAP_TEST_BOOL(skip_loops, ml_curr_index));
1305
1306                         /* A smooth edge, we have to check for cyclic smooth fan case.
1307                          * If we find a new, never-processed cyclic smooth fan, we can do it now using that loop/edge as
1308                          * 'entry point', otherwise we can skip it. */
1309                         /* Note: In theory, we could make loop_split_generator_check_cyclic_smooth_fan() store
1310                          * mlfan_vert_index'es and edge indexes in two stacks, to avoid having to fan again around the vert during
1311                          * actual computation of clnor & clnorspace. However, this would complicate the code, add more memory usage,
1312                          * and despite its logical complexity, loop_manifold_fan_around_vert_next() is quite cheap in term of
1313                          * CPU cycles, so really think it's not worth it. */
1314                         if (!IS_EDGE_SHARP(e2l_curr) &&
1315                             (BLI_BITMAP_TEST(skip_loops, ml_curr_index) ||
1316                              !loop_split_generator_check_cyclic_smooth_fan(
1317                                       mloops, mpolys, edge_to_loops, loop_to_poly, e2l_prev, skip_loops,
1318                                       ml_curr, ml_prev, ml_curr_index, ml_prev_index, mp_index)))
1319                         {
1320 //                              printf("SKIPPING!\n");
1321                         }
1322                         else {
1323                                 LoopSplitTaskData *data, data_local;
1324
1325 //                              printf("PROCESSING!\n");
1326
1327                                 if (pool) {
1328                                         if (data_idx == 0) {
1329                                                 data_buff = MEM_calloc_arrayN(LOOP_SPLIT_TASK_BLOCK_SIZE, sizeof(*data_buff), __func__);
1330                                         }
1331                                         data = &data_buff[data_idx];
1332                                 }
1333                                 else {
1334                                         data = &data_local;
1335                                         memset(data, 0, sizeof(*data));
1336                                 }
1337
1338                                 if (IS_EDGE_SHARP(e2l_curr) && IS_EDGE_SHARP(e2l_prev)) {
1339                                         data->lnor = lnors;
1340                                         data->ml_curr = ml_curr;
1341                                         data->ml_prev = ml_prev;
1342                                         data->ml_curr_index = ml_curr_index;
1343 #if 0  /* Not needed for 'single' loop. */
1344                                         data->ml_prev_index = ml_prev_index;
1345                                         data->e2l_prev = NULL;  /* Tag as 'single' task. */
1346 #endif
1347                                         data->mp_index = mp_index;
1348                                         if (lnors_spacearr) {
1349                                                 data->lnor_space = BKE_lnor_space_create(lnors_spacearr);
1350                                         }
1351                                 }
1352                                 /* We *do not need* to check/tag loops as already computed!
1353                                  * Due to the fact a loop only links to one of its two edges, a same fan *will never be walked
1354                                  * more than once!*
1355                                  * Since we consider edges having neighbor polys with inverted (flipped) normals as sharp, we are sure
1356                                  * that no fan will be skipped, even only considering the case (sharp curr_edge, smooth prev_edge),
1357                                  * and not the alternative (smooth curr_edge, sharp prev_edge).
1358                                  * All this due/thanks to link between normals and loop ordering (i.e. winding).
1359                                  */
1360                                 else {
1361 #if 0  /* Not needed for 'fan' loops. */
1362                                         data->lnor = lnors;
1363 #endif
1364                                         data->ml_curr = ml_curr;
1365                                         data->ml_prev = ml_prev;
1366                                         data->ml_curr_index = ml_curr_index;
1367                                         data->ml_prev_index = ml_prev_index;
1368                                         data->e2l_prev = e2l_prev;  /* Also tag as 'fan' task. */
1369                                         data->mp_index = mp_index;
1370                                         if (lnors_spacearr) {
1371                                                 data->lnor_space = BKE_lnor_space_create(lnors_spacearr);
1372                                         }
1373                                 }
1374
1375                                 if (pool) {
1376                                         data_idx++;
1377                                         if (data_idx == LOOP_SPLIT_TASK_BLOCK_SIZE) {
1378                                                 BLI_task_pool_push(pool, loop_split_worker, data_buff, true, TASK_PRIORITY_LOW);
1379                                                 data_idx = 0;
1380                                         }
1381                                 }
1382                                 else {
1383                                         loop_split_worker_do(common_data, data, edge_vectors);
1384                                 }
1385                         }
1386
1387                         ml_prev = ml_curr;
1388                         ml_prev_index = ml_curr_index;
1389                 }
1390         }
1391
1392         /* Last block of data... Since it is calloc'ed and we use first NULL item as stopper, everything is fine. */
1393         if (pool && data_idx) {
1394                 BLI_task_pool_push(pool, loop_split_worker, data_buff, true, TASK_PRIORITY_LOW);
1395         }
1396
1397         if (edge_vectors) {
1398                 BLI_stack_free(edge_vectors);
1399         }
1400         MEM_freeN(skip_loops);
1401
1402 #ifdef DEBUG_TIME
1403         TIMEIT_END_AVERAGED(loop_split_generator);
1404 #endif
1405 }
1406
1407 /**
1408  * Compute split normals, i.e. vertex normals associated with each poly (hence 'loop normals').
1409  * Useful to materialize sharp edges (or non-smooth faces) without actually modifying the geometry (splitting edges).
1410  */
1411 void BKE_mesh_normals_loop_split(
1412         const MVert *mverts, const int UNUSED(numVerts), MEdge *medges, const int numEdges,
1413         MLoop *mloops, float (*r_loopnors)[3], const int numLoops,
1414         MPoly *mpolys, const float (*polynors)[3], const int numPolys,
1415         const bool use_split_normals, const float split_angle,
1416         MLoopNorSpaceArray *r_lnors_spacearr, short (*clnors_data)[2], int *r_loop_to_poly)
1417 {
1418         /* For now this is not supported. If we do not use split normals, we do not generate anything fancy! */
1419         BLI_assert(use_split_normals || !(r_lnors_spacearr));
1420
1421         if (!use_split_normals) {
1422                 /* In this case, we simply fill lnors with vnors (or fnors for flat faces), quite simple!
1423                  * Note this is done here to keep some logic and consistency in this quite complex code,
1424                  * since we may want to use lnors even when mesh's 'autosmooth' is disabled (see e.g. mesh mapping code).
1425                  * As usual, we could handle that on case-by-case basis, but simpler to keep it well confined here.
1426                  */
1427                 int mp_index;
1428
1429                 for (mp_index = 0; mp_index < numPolys; mp_index++) {
1430                         MPoly *mp = &mpolys[mp_index];
1431                         int ml_index = mp->loopstart;
1432                         const int ml_index_end = ml_index + mp->totloop;
1433                         const bool is_poly_flat = ((mp->flag & ME_SMOOTH) == 0);
1434
1435                         for (; ml_index < ml_index_end; ml_index++) {
1436                                 if (r_loop_to_poly) {
1437                                         r_loop_to_poly[ml_index] = mp_index;
1438                                 }
1439                                 if (is_poly_flat) {
1440                                         copy_v3_v3(r_loopnors[ml_index], polynors[mp_index]);
1441                                 }
1442                                 else {
1443                                         normal_short_to_float_v3(r_loopnors[ml_index], mverts[mloops[ml_index].v].no);
1444                                 }
1445                         }
1446                 }
1447                 return;
1448         }
1449
1450         /* Mapping edge -> loops.
1451          * If that edge is used by more than two loops (polys), it is always sharp (and tagged as such, see below).
1452          * We also use the second loop index as a kind of flag: smooth edge: > 0,
1453          *                                                      sharp edge: < 0 (INDEX_INVALID || INDEX_UNSET),
1454          *                                                      unset: INDEX_UNSET
1455          * Note that currently we only have two values for second loop of sharp edges. However, if needed, we can
1456          * store the negated value of loop index instead of INDEX_INVALID to retrieve the real value later in code).
1457          * Note also that lose edges always have both values set to 0!
1458          */
1459         int (*edge_to_loops)[2] = MEM_calloc_arrayN((size_t)numEdges, sizeof(*edge_to_loops), __func__);
1460
1461         /* Simple mapping from a loop to its polygon index. */
1462         int *loop_to_poly = r_loop_to_poly ? r_loop_to_poly : MEM_malloc_arrayN((size_t)numLoops, sizeof(*loop_to_poly), __func__);
1463
1464         /* When using custom loop normals, disable the angle feature! */
1465         const bool check_angle = (split_angle < (float)M_PI) && (clnors_data == NULL);
1466
1467         MLoopNorSpaceArray _lnors_spacearr = {NULL};
1468
1469 #ifdef DEBUG_TIME
1470         TIMEIT_START_AVERAGED(BKE_mesh_normals_loop_split);
1471 #endif
1472
1473         if (!r_lnors_spacearr && clnors_data) {
1474                 /* We need to compute lnor spacearr if some custom lnor data are given to us! */
1475                 r_lnors_spacearr = &_lnors_spacearr;
1476         }
1477         if (r_lnors_spacearr) {
1478                 BKE_lnor_spacearr_init(r_lnors_spacearr, numLoops);
1479         }
1480
1481         /* Init data common to all tasks. */
1482         LoopSplitTaskDataCommon common_data = {
1483             .lnors_spacearr = r_lnors_spacearr,
1484             .loopnors = r_loopnors,
1485             .clnors_data = clnors_data,
1486             .mverts = mverts,
1487             .medges = medges,
1488             .mloops = mloops,
1489             .mpolys = mpolys,
1490             .edge_to_loops = edge_to_loops,
1491             .loop_to_poly = loop_to_poly,
1492             .polynors = polynors,
1493             .numEdges = numEdges,
1494             .numLoops = numLoops,
1495             .numPolys = numPolys,
1496         };
1497
1498         /* This first loop check which edges are actually smooth, and compute edge vectors. */
1499         mesh_edges_sharp_tag(&common_data, check_angle, split_angle, false);
1500
1501         if (numLoops < LOOP_SPLIT_TASK_BLOCK_SIZE * 8) {
1502                 /* Not enough loops to be worth the whole threading overhead... */
1503                 loop_split_generator(NULL, &common_data);
1504         }
1505         else {
1506                 TaskScheduler *task_scheduler;
1507                 TaskPool *task_pool;
1508
1509                 task_scheduler = BLI_task_scheduler_get();
1510                 task_pool = BLI_task_pool_create(task_scheduler, &common_data);
1511
1512                 loop_split_generator(task_pool, &common_data);
1513
1514                 BLI_task_pool_work_and_wait(task_pool);
1515
1516                 BLI_task_pool_free(task_pool);
1517         }
1518
1519         MEM_freeN(edge_to_loops);
1520         if (!r_loop_to_poly) {
1521                 MEM_freeN(loop_to_poly);
1522         }
1523
1524         if (r_lnors_spacearr) {
1525                 if (r_lnors_spacearr == &_lnors_spacearr) {
1526                         BKE_lnor_spacearr_free(r_lnors_spacearr);
1527                 }
1528         }
1529
1530 #ifdef DEBUG_TIME
1531         TIMEIT_END_AVERAGED(BKE_mesh_normals_loop_split);
1532 #endif
1533 }
1534
1535 #undef INDEX_UNSET
1536 #undef INDEX_INVALID
1537 #undef IS_EDGE_SHARP
1538
1539 /**
1540  * Compute internal representation of given custom normals (as an array of float[2]).
1541  * It also makes sure the mesh matches those custom normals, by setting sharp edges flag as needed to get a
1542  * same custom lnor for all loops sharing a same smooth fan.
1543  * If use_vertices if true, r_custom_loopnors is assumed to be per-vertex, not per-loop
1544  * (this allows to set whole vert's normals at once, useful in some cases).
1545  * r_custom_loopnors is expected to have normalized normals, or zero ones, in which case they will be replaced
1546  * by default loop/vertex normal.
1547  */
1548 static void mesh_normals_loop_custom_set(
1549         const MVert *mverts, const int numVerts, MEdge *medges, const int numEdges,
1550         MLoop *mloops, float (*r_custom_loopnors)[3], const int numLoops,
1551         MPoly *mpolys, const float (*polynors)[3], const int numPolys,
1552         short (*r_clnors_data)[2], const bool use_vertices)
1553 {
1554         /* We *may* make that poor BKE_mesh_normals_loop_split() even more complex by making it handling that
1555          * feature too, would probably be more efficient in absolute.
1556          * However, this function *is not* performance-critical, since it is mostly expected to be called
1557          * by io addons when importing custom normals, and modifier (and perhaps from some editing tools later?).
1558          * So better to keep some simplicity here, and just call BKE_mesh_normals_loop_split() twice!
1559          */
1560         MLoopNorSpaceArray lnors_spacearr = {NULL};
1561         BLI_bitmap *done_loops = BLI_BITMAP_NEW((size_t)numLoops, __func__);
1562         float (*lnors)[3] = MEM_calloc_arrayN((size_t)numLoops, sizeof(*lnors), __func__);
1563         int *loop_to_poly = MEM_malloc_arrayN((size_t)numLoops, sizeof(int), __func__);
1564         /* In this case we always consider split nors as ON, and do not want to use angle to define smooth fans! */
1565         const bool use_split_normals = true;
1566         const float split_angle = (float)M_PI;
1567         int i;
1568
1569         BLI_SMALLSTACK_DECLARE(clnors_data, short *);
1570
1571         /* Compute current lnor spacearr. */
1572         BKE_mesh_normals_loop_split(mverts, numVerts, medges, numEdges, mloops, lnors, numLoops,
1573                                     mpolys, polynors, numPolys, use_split_normals, split_angle,
1574                                     &lnors_spacearr, NULL, loop_to_poly);
1575
1576         /* Set all given zero vectors to their default value. */
1577         if (use_vertices) {
1578                 for (i = 0; i < numVerts; i++) {
1579                         if (is_zero_v3(r_custom_loopnors[i])) {
1580                                 normal_short_to_float_v3(r_custom_loopnors[i], mverts[i].no);
1581                         }
1582                 }
1583         }
1584         else {
1585                 for (i = 0; i < numLoops; i++) {
1586                         if (is_zero_v3(r_custom_loopnors[i])) {
1587                                 copy_v3_v3(r_custom_loopnors[i], lnors[i]);
1588                         }
1589                 }
1590         }
1591
1592         /* Now, check each current smooth fan (one lnor space per smooth fan!), and if all its matching custom lnors
1593          * are not (enough) equal, add sharp edges as needed.
1594          * This way, next time we run BKE_mesh_normals_loop_split(), we'll get lnor spacearr/smooth fans matching
1595          * given custom lnors.
1596          * Note this code *will never* unsharp edges!
1597          * And quite obviously, when we set custom normals per vertices, running this is absolutely useless.
1598          */
1599         if (!use_vertices) {
1600                 for (i = 0; i < numLoops; i++) {
1601                         if (!lnors_spacearr.lspacearr[i]) {
1602                                 /* This should not happen in theory, but in some rare case (probably ugly geometry)
1603                                  * we can get some NULL loopspacearr at this point. :/
1604                                  * Maybe we should set those loops' edges as sharp?
1605                                  */
1606                                 BLI_BITMAP_ENABLE(done_loops, i);
1607                                 if (G.debug & G_DEBUG) {
1608                                         printf("WARNING! Getting invalid NULL loop space for loop %d!\n", i);
1609                                 }
1610                                 continue;
1611                         }
1612
1613                         if (!BLI_BITMAP_TEST(done_loops, i)) {
1614                                 /* Notes:
1615                                  *     * In case of mono-loop smooth fan, loops is NULL, so everything is fine (we have nothing to do).
1616                                  *     * Loops in this linklist are ordered (in reversed order compared to how they were discovered by
1617                                  *       BKE_mesh_normals_loop_split(), but this is not a problem). Which means if we find a
1618                                  *       mismatching clnor, we know all remaining loops will have to be in a new, different smooth fan/
1619                                  *       lnor space.
1620                                  *     * In smooth fan case, we compare each clnor against a ref one, to avoid small differences adding
1621                                  *       up into a real big one in the end!
1622                                  */
1623                                 LinkNode *loops = lnors_spacearr.lspacearr[i]->loops;
1624                                 MLoop *prev_ml = NULL;
1625                                 const float *org_nor = NULL;
1626
1627                                 while (loops) {
1628                                         const int lidx = GET_INT_FROM_POINTER(loops->link);
1629                                         MLoop *ml = &mloops[lidx];
1630                                         const int nidx = lidx;
1631                                         float *nor = r_custom_loopnors[nidx];
1632
1633                                         if (!org_nor) {
1634                                                 org_nor = nor;
1635                                         }
1636                                         else if (dot_v3v3(org_nor, nor) < LNOR_SPACE_TRIGO_THRESHOLD) {
1637                                                 /* Current normal differs too much from org one, we have to tag the edge between
1638                                                  * previous loop's face and current's one as sharp.
1639                                                  * We know those two loops do not point to the same edge, since we do not allow reversed winding
1640                                                  * in a same smooth fan.
1641                                                  */
1642                                                 const MPoly *mp = &mpolys[loop_to_poly[lidx]];
1643                                                 const MLoop *mlp = &mloops[(lidx == mp->loopstart) ? mp->loopstart + mp->totloop - 1 : lidx - 1];
1644                                                 medges[(prev_ml->e == mlp->e) ? prev_ml->e : ml->e].flag |= ME_SHARP;
1645
1646                                                 org_nor = nor;
1647                                         }
1648
1649                                         prev_ml = ml;
1650                                         loops = loops->next;
1651                                         BLI_BITMAP_ENABLE(done_loops, lidx);
1652                                 }
1653
1654                                 /* We also have to check between last and first loops, otherwise we may miss some sharp edges here!
1655                                  * This is just a simplified version of above while loop.
1656                                  * See T45984. */
1657                                 loops = lnors_spacearr.lspacearr[i]->loops;
1658                                 if (loops && org_nor) {
1659                                         const int lidx = GET_INT_FROM_POINTER(loops->link);
1660                                         MLoop *ml = &mloops[lidx];
1661                                         const int nidx = lidx;
1662                                         float *nor = r_custom_loopnors[nidx];
1663
1664                                         if (dot_v3v3(org_nor, nor) < LNOR_SPACE_TRIGO_THRESHOLD) {
1665                                                 const MPoly *mp = &mpolys[loop_to_poly[lidx]];
1666                                                 const MLoop *mlp = &mloops[(lidx == mp->loopstart) ? mp->loopstart + mp->totloop - 1 : lidx - 1];
1667                                                 medges[(prev_ml->e == mlp->e) ? prev_ml->e : ml->e].flag |= ME_SHARP;
1668                                         }
1669                                 }
1670
1671                                 /* For single loops, where lnors_spacearr.lspacearr[i]->loops is NULL. */
1672                                 BLI_BITMAP_ENABLE(done_loops, i);
1673                         }
1674                 }
1675
1676                 /* And now, recompute our new auto lnors and lnor spacearr! */
1677                 BKE_lnor_spacearr_clear(&lnors_spacearr);
1678                 BKE_mesh_normals_loop_split(mverts, numVerts, medges, numEdges, mloops, lnors, numLoops,
1679                                             mpolys, polynors, numPolys, use_split_normals, split_angle,
1680                                             &lnors_spacearr, NULL, loop_to_poly);
1681         }
1682         else {
1683                 BLI_BITMAP_SET_ALL(done_loops, true, (size_t)numLoops);
1684         }
1685
1686         /* And we just have to convert plain object-space custom normals to our lnor space-encoded ones. */
1687         for (i = 0; i < numLoops; i++) {
1688                 if (!lnors_spacearr.lspacearr[i]) {
1689                         BLI_BITMAP_DISABLE(done_loops, i);
1690                         if (G.debug & G_DEBUG) {
1691                                 printf("WARNING! Still getting invalid NULL loop space in second loop for loop %d!\n", i);
1692                         }
1693                         continue;
1694                 }
1695
1696                 if (BLI_BITMAP_TEST_BOOL(done_loops, i)) {
1697                         /* Note we accumulate and average all custom normals in current smooth fan, to avoid getting different
1698                          * clnors data (tiny differences in plain custom normals can give rather huge differences in
1699                          * computed 2D factors).
1700                          */
1701                         LinkNode *loops = lnors_spacearr.lspacearr[i]->loops;
1702                         if (loops) {
1703                                 int nbr_nors = 0;
1704                                 float avg_nor[3];
1705                                 short clnor_data_tmp[2], *clnor_data;
1706
1707                                 zero_v3(avg_nor);
1708                                 while (loops) {
1709                                         const int lidx = GET_INT_FROM_POINTER(loops->link);
1710                                         const int nidx = use_vertices ? (int)mloops[lidx].v : lidx;
1711                                         float *nor = r_custom_loopnors[nidx];
1712
1713                                         nbr_nors++;
1714                                         add_v3_v3(avg_nor, nor);
1715                                         BLI_SMALLSTACK_PUSH(clnors_data, (short *)r_clnors_data[lidx]);
1716
1717                                         loops = loops->next;
1718                                         BLI_BITMAP_DISABLE(done_loops, lidx);
1719                                 }
1720
1721                                 mul_v3_fl(avg_nor, 1.0f / (float)nbr_nors);
1722                                 BKE_lnor_space_custom_normal_to_data(lnors_spacearr.lspacearr[i], avg_nor, clnor_data_tmp);
1723
1724                                 while ((clnor_data = BLI_SMALLSTACK_POP(clnors_data))) {
1725                                         clnor_data[0] = clnor_data_tmp[0];
1726                                         clnor_data[1] = clnor_data_tmp[1];
1727                                 }
1728                         }
1729                         else {
1730                                 const int nidx = use_vertices ? (int)mloops[i].v : i;
1731                                 float *nor = r_custom_loopnors[nidx];
1732
1733                                 BKE_lnor_space_custom_normal_to_data(lnors_spacearr.lspacearr[i], nor, r_clnors_data[i]);
1734                                 BLI_BITMAP_DISABLE(done_loops, i);
1735                         }
1736                 }
1737         }
1738
1739         MEM_freeN(lnors);
1740         MEM_freeN(loop_to_poly);
1741         MEM_freeN(done_loops);
1742         BKE_lnor_spacearr_free(&lnors_spacearr);
1743 }
1744
1745 void BKE_mesh_normals_loop_custom_set(
1746         const MVert *mverts, const int numVerts, MEdge *medges, const int numEdges,
1747         MLoop *mloops, float (*r_custom_loopnors)[3], const int numLoops,
1748         MPoly *mpolys, const float (*polynors)[3], const int numPolys,
1749         short (*r_clnors_data)[2])
1750 {
1751         mesh_normals_loop_custom_set(mverts, numVerts, medges, numEdges, mloops, r_custom_loopnors, numLoops,
1752                                      mpolys, polynors, numPolys, r_clnors_data, false);
1753 }
1754
1755 void BKE_mesh_normals_loop_custom_from_vertices_set(
1756         const MVert *mverts, float (*r_custom_vertnors)[3], const int numVerts,
1757         MEdge *medges, const int numEdges, MLoop *mloops, const int numLoops,
1758         MPoly *mpolys, const float (*polynors)[3], const int numPolys,
1759         short (*r_clnors_data)[2])
1760 {
1761         mesh_normals_loop_custom_set(mverts, numVerts, medges, numEdges, mloops, r_custom_vertnors, numLoops,
1762                                      mpolys, polynors, numPolys, r_clnors_data, true);
1763 }
1764
1765 /**
1766  * Computes average per-vertex normals from given custom loop normals.
1767  *
1768  * \param clnors: The computed custom loop normals.
1769  * \param r_vert_clnors: The (already allocated) array where to store averaged per-vertex normals.
1770  */
1771 void BKE_mesh_normals_loop_to_vertex(
1772         const int numVerts, const MLoop *mloops, const int numLoops,
1773         const float (*clnors)[3], float (*r_vert_clnors)[3])
1774 {
1775         const MLoop *ml;
1776         int i;
1777
1778         int *vert_loops_nbr = MEM_calloc_arrayN((size_t)numVerts, sizeof(*vert_loops_nbr), __func__);
1779
1780         copy_vn_fl((float *)r_vert_clnors, 3 * numVerts, 0.0f);
1781
1782         for (i = 0, ml = mloops; i < numLoops; i++, ml++) {
1783                 const unsigned int v = ml->v;
1784
1785                 add_v3_v3(r_vert_clnors[v], clnors[i]);
1786                 vert_loops_nbr[v]++;
1787         }
1788
1789         for (i = 0; i < numVerts; i++) {
1790                 mul_v3_fl(r_vert_clnors[i], 1.0f / (float)vert_loops_nbr[i]);
1791         }
1792
1793         MEM_freeN(vert_loops_nbr);
1794 }
1795
1796
1797 #undef LNOR_SPACE_TRIGO_THRESHOLD
1798
1799 /** \} */
1800
1801
1802 /* -------------------------------------------------------------------- */
1803
1804 /** \name Mesh Tangent Calculations
1805  * \{ */
1806
1807 /* Tangent space utils. */
1808
1809 /* User data. */
1810 typedef struct {
1811         const MPoly *mpolys;   /* faces */
1812         const MLoop *mloops;   /* faces's vertices */
1813         const MVert *mverts;   /* vertices */
1814         const MLoopUV *luvs;   /* texture coordinates */
1815         float (*lnors)[3];     /* loops' normals */
1816         float (*tangents)[4];  /* output tangents */
1817         int num_polys;         /* number of polygons */
1818 } BKEMeshToTangent;
1819
1820 /* Mikktspace's API */
1821 static int get_num_faces(const SMikkTSpaceContext *pContext)
1822 {
1823         BKEMeshToTangent *p_mesh = (BKEMeshToTangent *)pContext->m_pUserData;
1824         return p_mesh->num_polys;
1825 }
1826
1827 static int get_num_verts_of_face(const SMikkTSpaceContext *pContext, const int face_idx)
1828 {
1829         BKEMeshToTangent *p_mesh = (BKEMeshToTangent *)pContext->m_pUserData;
1830         return p_mesh->mpolys[face_idx].totloop;
1831 }
1832
1833 static void get_position(const SMikkTSpaceContext *pContext, float r_co[3], const int face_idx, const int vert_idx)
1834 {
1835         BKEMeshToTangent *p_mesh = (BKEMeshToTangent *)pContext->m_pUserData;
1836         const int loop_idx = p_mesh->mpolys[face_idx].loopstart + vert_idx;
1837         copy_v3_v3(r_co, p_mesh->mverts[p_mesh->mloops[loop_idx].v].co);
1838 }
1839
1840 static void get_texture_coordinate(const SMikkTSpaceContext *pContext, float r_uv[2], const int face_idx,
1841                                    const int vert_idx)
1842 {
1843         BKEMeshToTangent *p_mesh = (BKEMeshToTangent *)pContext->m_pUserData;
1844         copy_v2_v2(r_uv, p_mesh->luvs[p_mesh->mpolys[face_idx].loopstart + vert_idx].uv);
1845 }
1846
1847 static void get_normal(const SMikkTSpaceContext *pContext, float r_no[3], const int face_idx, const int vert_idx)
1848 {
1849         BKEMeshToTangent *p_mesh = (BKEMeshToTangent *)pContext->m_pUserData;
1850         copy_v3_v3(r_no, p_mesh->lnors[p_mesh->mpolys[face_idx].loopstart + vert_idx]);
1851 }
1852
1853 static void set_tspace(const SMikkTSpaceContext *pContext, const float fv_tangent[3], const float face_sign,
1854                        const int face_idx, const int vert_idx)
1855 {
1856         BKEMeshToTangent *p_mesh = (BKEMeshToTangent *)pContext->m_pUserData;
1857         float *p_res = p_mesh->tangents[p_mesh->mpolys[face_idx].loopstart + vert_idx];
1858         copy_v3_v3(p_res, fv_tangent);
1859         p_res[3] = face_sign;
1860 }
1861
1862 /**
1863  * Compute simplified tangent space normals, i.e. tangent vector + sign of bi-tangent one, which combined with
1864  * split normals can be used to recreate the full tangent space.
1865  * Note: * The mesh should be made of only tris and quads!
1866  */
1867 void BKE_mesh_loop_tangents_ex(
1868         const MVert *mverts, const int UNUSED(numVerts), const MLoop *mloops,
1869         float (*r_looptangent)[4], float (*loopnors)[3], const MLoopUV *loopuvs,
1870         const int UNUSED(numLoops), const MPoly *mpolys, const int numPolys,
1871         ReportList *reports)
1872 {
1873         BKEMeshToTangent mesh_to_tangent = {NULL};
1874         SMikkTSpaceContext s_context = {NULL};
1875         SMikkTSpaceInterface s_interface = {NULL};
1876
1877         const MPoly *mp;
1878         int mp_index;
1879
1880         /* First check we do have a tris/quads only mesh. */
1881         for (mp = mpolys, mp_index = 0; mp_index < numPolys; mp++, mp_index++) {
1882                 if (mp->totloop > 4) {
1883                         BKE_report(reports, RPT_ERROR, "Tangent space can only be computed for tris/quads, aborting");
1884                         return;
1885                 }
1886         }
1887
1888         /* Compute Mikktspace's tangent normals. */
1889         mesh_to_tangent.mpolys = mpolys;
1890         mesh_to_tangent.mloops = mloops;
1891         mesh_to_tangent.mverts = mverts;
1892         mesh_to_tangent.luvs = loopuvs;
1893         mesh_to_tangent.lnors = loopnors;
1894         mesh_to_tangent.tangents = r_looptangent;
1895         mesh_to_tangent.num_polys = numPolys;
1896
1897         s_context.m_pUserData = &mesh_to_tangent;
1898         s_context.m_pInterface = &s_interface;
1899         s_interface.m_getNumFaces = get_num_faces;
1900         s_interface.m_getNumVerticesOfFace = get_num_verts_of_face;
1901         s_interface.m_getPosition = get_position;
1902         s_interface.m_getTexCoord = get_texture_coordinate;
1903         s_interface.m_getNormal = get_normal;
1904         s_interface.m_setTSpaceBasic = set_tspace;
1905
1906         /* 0 if failed */
1907         if (genTangSpaceDefault(&s_context) == false) {
1908                 BKE_report(reports, RPT_ERROR, "Mikktspace failed to generate tangents for this mesh!");
1909         }
1910 }
1911
1912 /**
1913  * Wrapper around BKE_mesh_loop_tangents_ex, which takes care of most boiling code.
1914  * \note
1915  * - There must be a valid loop's CD_NORMALS available.
1916  * - The mesh should be made of only tris and quads!
1917  */
1918 void BKE_mesh_loop_tangents(Mesh *mesh, const char *uvmap, float (*r_looptangents)[4], ReportList *reports)
1919 {
1920         MLoopUV *loopuvs;
1921         float (*loopnors)[3];
1922
1923         /* Check we have valid texture coordinates first! */
1924         if (uvmap) {
1925                 loopuvs = CustomData_get_layer_named(&mesh->ldata, CD_MLOOPUV, uvmap);
1926         }
1927         else {
1928                 loopuvs = CustomData_get_layer(&mesh->ldata, CD_MLOOPUV);
1929         }
1930         if (!loopuvs) {
1931                 BKE_reportf(reports, RPT_ERROR, "Tangent space computation needs an UVMap, \"%s\" not found, aborting", uvmap);
1932                 return;
1933         }
1934
1935         loopnors = CustomData_get_layer(&mesh->ldata, CD_NORMAL);
1936         if (!loopnors) {
1937                 BKE_report(reports, RPT_ERROR, "Tangent space computation needs loop normals, none found, aborting");
1938                 return;
1939         }
1940
1941         BKE_mesh_loop_tangents_ex(mesh->mvert, mesh->totvert, mesh->mloop, r_looptangents,
1942                                   loopnors, loopuvs, mesh->totloop, mesh->mpoly, mesh->totpoly, reports);
1943 }
1944
1945 /** \} */
1946
1947
1948 /* -------------------------------------------------------------------- */
1949
1950 /** \name Polygon Calculations
1951  * \{ */
1952
1953 /*
1954  * COMPUTE POLY NORMAL
1955  *
1956  * Computes the normal of a planar
1957  * polygon See Graphics Gems for
1958  * computing newell normal.
1959  *
1960  */
1961 static void mesh_calc_ngon_normal(
1962         const MPoly *mpoly, const MLoop *loopstart,
1963         const MVert *mvert, float normal[3])
1964 {
1965         const int nverts = mpoly->totloop;
1966         const float *v_prev = mvert[loopstart[nverts - 1].v].co;
1967         const float *v_curr;
1968         int i;
1969
1970         zero_v3(normal);
1971
1972         /* Newell's Method */
1973         for (i = 0; i < nverts; i++) {
1974                 v_curr = mvert[loopstart[i].v].co;
1975                 add_newell_cross_v3_v3v3(normal, v_prev, v_curr);
1976                 v_prev = v_curr;
1977         }
1978
1979         if (UNLIKELY(normalize_v3(normal) == 0.0f)) {
1980                 normal[2] = 1.0f; /* other axis set to 0.0 */
1981         }
1982 }
1983
1984 void BKE_mesh_calc_poly_normal(
1985         const MPoly *mpoly, const MLoop *loopstart,
1986         const MVert *mvarray, float r_no[3])
1987 {
1988         if (mpoly->totloop > 4) {
1989                 mesh_calc_ngon_normal(mpoly, loopstart, mvarray, r_no);
1990         }
1991         else if (mpoly->totloop == 3) {
1992                 normal_tri_v3(r_no,
1993                               mvarray[loopstart[0].v].co,
1994                               mvarray[loopstart[1].v].co,
1995                               mvarray[loopstart[2].v].co
1996                               );
1997         }
1998         else if (mpoly->totloop == 4) {
1999                 normal_quad_v3(r_no,
2000                                mvarray[loopstart[0].v].co,
2001                                mvarray[loopstart[1].v].co,
2002                                mvarray[loopstart[2].v].co,
2003                                mvarray[loopstart[3].v].co
2004                                );
2005         }
2006         else { /* horrible, two sided face! */
2007                 r_no[0] = 0.0;
2008                 r_no[1] = 0.0;
2009                 r_no[2] = 1.0;
2010         }
2011 }
2012 /* duplicate of function above _but_ takes coords rather then mverts */
2013 static void mesh_calc_ngon_normal_coords(
2014         const MPoly *mpoly, const MLoop *loopstart,
2015         const float (*vertex_coords)[3], float r_normal[3])
2016 {
2017         const int nverts = mpoly->totloop;
2018         const float *v_prev = vertex_coords[loopstart[nverts - 1].v];
2019         const float *v_curr;
2020         int i;
2021
2022         zero_v3(r_normal);
2023
2024         /* Newell's Method */
2025         for (i = 0; i < nverts; i++) {
2026                 v_curr = vertex_coords[loopstart[i].v];
2027                 add_newell_cross_v3_v3v3(r_normal, v_prev, v_curr);
2028                 v_prev = v_curr;
2029         }
2030
2031         if (UNLIKELY(normalize_v3(r_normal) == 0.0f)) {
2032                 r_normal[2] = 1.0f; /* other axis set to 0.0 */
2033         }
2034 }
2035
2036 void BKE_mesh_calc_poly_normal_coords(
2037         const MPoly *mpoly, const MLoop *loopstart,
2038         const float (*vertex_coords)[3], float r_no[3])
2039 {
2040         if (mpoly->totloop > 4) {
2041                 mesh_calc_ngon_normal_coords(mpoly, loopstart, vertex_coords, r_no);
2042         }
2043         else if (mpoly->totloop == 3) {
2044                 normal_tri_v3(r_no,
2045                               vertex_coords[loopstart[0].v],
2046                               vertex_coords[loopstart[1].v],
2047                               vertex_coords[loopstart[2].v]
2048                               );
2049         }
2050         else if (mpoly->totloop == 4) {
2051                 normal_quad_v3(r_no,
2052                                vertex_coords[loopstart[0].v],
2053                                vertex_coords[loopstart[1].v],
2054                                vertex_coords[loopstart[2].v],
2055                                vertex_coords[loopstart[3].v]
2056                                );
2057         }
2058         else { /* horrible, two sided face! */
2059                 r_no[0] = 0.0;
2060                 r_no[1] = 0.0;
2061                 r_no[2] = 1.0;
2062         }
2063 }
2064
2065 static void mesh_calc_ngon_center(
2066         const MPoly *mpoly, const MLoop *loopstart,
2067         const MVert *mvert, float cent[3])
2068 {
2069         const float w = 1.0f / (float)mpoly->totloop;
2070         int i;
2071
2072         zero_v3(cent);
2073
2074         for (i = 0; i < mpoly->totloop; i++) {
2075                 madd_v3_v3fl(cent, mvert[(loopstart++)->v].co, w);
2076         }
2077 }
2078
2079 void BKE_mesh_calc_poly_center(
2080         const MPoly *mpoly, const MLoop *loopstart,
2081         const MVert *mvarray, float r_cent[3])
2082 {
2083         if (mpoly->totloop == 3) {
2084                 mid_v3_v3v3v3(r_cent,
2085                               mvarray[loopstart[0].v].co,
2086                               mvarray[loopstart[1].v].co,
2087                               mvarray[loopstart[2].v].co
2088                               );
2089         }
2090         else if (mpoly->totloop == 4) {
2091                 mid_v3_v3v3v3v3(r_cent,
2092                                 mvarray[loopstart[0].v].co,
2093                                 mvarray[loopstart[1].v].co,
2094                                 mvarray[loopstart[2].v].co,
2095                                 mvarray[loopstart[3].v].co
2096                                 );
2097         }
2098         else {
2099                 mesh_calc_ngon_center(mpoly, loopstart, mvarray, r_cent);
2100         }
2101 }
2102
2103 /* note, passing polynormal is only a speedup so we can skip calculating it */
2104 float BKE_mesh_calc_poly_area(
2105         const MPoly *mpoly, const MLoop *loopstart,
2106         const MVert *mvarray)
2107 {
2108         if (mpoly->totloop == 3) {
2109                 return area_tri_v3(mvarray[loopstart[0].v].co,
2110                                    mvarray[loopstart[1].v].co,
2111                                    mvarray[loopstart[2].v].co
2112                                    );
2113         }
2114         else {
2115                 int i;
2116                 const MLoop *l_iter = loopstart;
2117                 float area;
2118                 float (*vertexcos)[3] = BLI_array_alloca(vertexcos, (size_t)mpoly->totloop);
2119
2120                 /* pack vertex cos into an array for area_poly_v3 */
2121                 for (i = 0; i < mpoly->totloop; i++, l_iter++) {
2122                         copy_v3_v3(vertexcos[i], mvarray[l_iter->v].co);
2123                 }
2124
2125                 /* finally calculate the area */
2126                 area = area_poly_v3((const float (*)[3])vertexcos, (unsigned int)mpoly->totloop);
2127
2128                 return area;
2129         }
2130 }
2131
2132 /**
2133  * Calculate the volume and volume-weighted centroid of the volume formed by the polygon and the origin.
2134  * Results will be negative if the origin is "outside" the polygon
2135  * (+ve normal side), but the polygon may be non-planar with no effect.
2136  *
2137  * Method from:
2138  * - http://forums.cgsociety.org/archive/index.php?t-756235.html
2139  * - http://www.globalspec.com/reference/52702/203279/4-8-the-centroid-of-a-tetrahedron
2140  *
2141  * \note
2142  * - Volume is 6x actual volume, and centroid is 4x actual volume-weighted centroid
2143  *   (so division can be done once at the end).
2144  * - Results will have bias if polygon is non-planar.
2145  * - The resulting volume will only be correct if the mesh is manifold and has consistent face winding
2146  *   (non-contiguous face normals or holes in the mesh surface).
2147  */
2148 static float mesh_calc_poly_volume_centroid(
2149         const MPoly *mpoly, const MLoop *loopstart, const MVert *mvarray,
2150         float r_cent[3])
2151 {
2152         const float *v_pivot, *v_step1;
2153         float total_volume = 0.0f;
2154
2155         zero_v3(r_cent);
2156
2157         v_pivot = mvarray[loopstart[0].v].co;
2158         v_step1 = mvarray[loopstart[1].v].co;
2159
2160         for (int i = 2; i < mpoly->totloop; i++) {
2161                 const float *v_step2 = mvarray[loopstart[i].v].co;
2162
2163                 /* Calculate the 6x volume of the tetrahedron formed by the 3 vertices
2164                  * of the triangle and the origin as the fourth vertex */
2165                 float v_cross[3];
2166                 cross_v3_v3v3(v_cross, v_pivot, v_step1);
2167                 const float tetra_volume = dot_v3v3 (v_cross, v_step2);
2168                 total_volume += tetra_volume;
2169
2170                 /* Calculate the centroid of the tetrahedron formed by the 3 vertices
2171                  * of the triangle and the origin as the fourth vertex.
2172                  * The centroid is simply the average of the 4 vertices.
2173                  *
2174                  * Note that the vector is 4x the actual centroid so the division can be done once at the end. */
2175                 for (uint j = 0; j < 3; j++) {
2176                         r_cent[j] += tetra_volume * (v_pivot[j] + v_step1[j] + v_step2[j]);
2177                 }
2178
2179                 v_step1 = v_step2;
2180         }
2181
2182         return total_volume;
2183 }
2184
2185 /**
2186  * \note
2187  * - Results won't be correct if polygon is non-planar.
2188  * - This has the advantage over #mesh_calc_poly_volume_centroid
2189  *   that it doesn't depend on solid geometry, instead it weights the surface by volume.
2190  */
2191 static float mesh_calc_poly_area_centroid(
2192         const MPoly *mpoly, const MLoop *loopstart, const MVert *mvarray,
2193         float r_cent[3])
2194 {
2195         int i;
2196         float tri_area;
2197         float total_area = 0.0f;
2198         float v1[3], v2[3], v3[3], normal[3], tri_cent[3];
2199
2200         BKE_mesh_calc_poly_normal(mpoly, loopstart, mvarray, normal);
2201         copy_v3_v3(v1, mvarray[loopstart[0].v].co);
2202         copy_v3_v3(v2, mvarray[loopstart[1].v].co);
2203         zero_v3(r_cent);
2204
2205         for (i = 2; i < mpoly->totloop; i++) {
2206                 copy_v3_v3(v3, mvarray[loopstart[i].v].co);
2207
2208                 tri_area = area_tri_signed_v3(v1, v2, v3, normal);
2209                 total_area += tri_area;
2210
2211                 mid_v3_v3v3v3(tri_cent, v1, v2, v3);
2212                 madd_v3_v3fl(r_cent, tri_cent, tri_area);
2213
2214                 copy_v3_v3(v2, v3);
2215         }
2216
2217         mul_v3_fl(r_cent, 1.0f / total_area);
2218
2219         return total_area;
2220 }
2221
2222 #if 0 /* slow version of the function below */
2223 void BKE_mesh_calc_poly_angles(MPoly *mpoly, MLoop *loopstart,
2224                                MVert *mvarray, float angles[])
2225 {
2226         MLoop *ml;
2227         MLoop *mloop = &loopstart[-mpoly->loopstart];
2228
2229         int j;
2230         for (j = 0, ml = loopstart; j < mpoly->totloop; j++, ml++) {
2231                 MLoop *ml_prev = ME_POLY_LOOP_PREV(mloop, mpoly, j);
2232                 MLoop *ml_next = ME_POLY_LOOP_NEXT(mloop, mpoly, j);
2233
2234                 float e1[3], e2[3];
2235
2236                 sub_v3_v3v3(e1, mvarray[ml_next->v].co, mvarray[ml->v].co);
2237                 sub_v3_v3v3(e2, mvarray[ml_prev->v].co, mvarray[ml->v].co);
2238
2239                 angles[j] = (float)M_PI - angle_v3v3(e1, e2);
2240         }
2241 }
2242
2243 #else /* equivalent the function above but avoid multiple subtractions + normalize */
2244
2245 void BKE_mesh_calc_poly_angles(
2246         const MPoly *mpoly, const MLoop *loopstart,
2247         const MVert *mvarray, float angles[])
2248 {
2249         float nor_prev[3];
2250         float nor_next[3];
2251
2252         int i_this = mpoly->totloop - 1;
2253         int i_next = 0;
2254
2255         sub_v3_v3v3(nor_prev, mvarray[loopstart[i_this - 1].v].co, mvarray[loopstart[i_this].v].co);
2256         normalize_v3(nor_prev);
2257
2258         while (i_next < mpoly->totloop) {
2259                 sub_v3_v3v3(nor_next, mvarray[loopstart[i_this].v].co, mvarray[loopstart[i_next].v].co);
2260                 normalize_v3(nor_next);
2261                 angles[i_this] = angle_normalized_v3v3(nor_prev, nor_next);
2262
2263                 /* step */
2264                 copy_v3_v3(nor_prev, nor_next);
2265                 i_this = i_next;
2266                 i_next++;
2267         }
2268 }
2269 #endif
2270
2271 void BKE_mesh_poly_edgehash_insert(EdgeHash *ehash, const MPoly *mp, const MLoop *mloop)
2272 {
2273         const MLoop *ml, *ml_next;
2274         int i = mp->totloop;
2275
2276         ml_next = mloop;       /* first loop */
2277         ml = &ml_next[i - 1];  /* last loop */
2278
2279         while (i-- != 0) {
2280                 BLI_edgehash_reinsert(ehash, ml->v, ml_next->v, NULL);
2281
2282                 ml = ml_next;
2283                 ml_next++;
2284         }
2285 }
2286
2287 void BKE_mesh_poly_edgebitmap_insert(unsigned int *edge_bitmap, const MPoly *mp, const MLoop *mloop)
2288 {
2289         const MLoop *ml;
2290         int i = mp->totloop;
2291
2292         ml = mloop;
2293
2294         while (i-- != 0) {
2295                 BLI_BITMAP_ENABLE(edge_bitmap, ml->e);
2296                 ml++;
2297         }
2298 }
2299
2300 /** \} */
2301
2302
2303 /* -------------------------------------------------------------------- */
2304
2305 /** \name Mesh Center Calculation
2306  * \{ */
2307
2308 bool BKE_mesh_center_median(const Mesh *me, float r_cent[3])
2309 {
2310         int i = me->totvert;
2311         const MVert *mvert;
2312         zero_v3(r_cent);
2313         for (mvert = me->mvert; i--; mvert++) {
2314                 add_v3_v3(r_cent, mvert->co);
2315         }
2316         /* otherwise we get NAN for 0 verts */
2317         if (me->totvert) {
2318                 mul_v3_fl(r_cent, 1.0f / (float)me->totvert);
2319         }
2320
2321         return (me->totvert != 0);
2322 }
2323
2324 bool BKE_mesh_center_bounds(const Mesh *me, float r_cent[3])
2325 {
2326         float min[3], max[3];
2327         INIT_MINMAX(min, max);
2328         if (BKE_mesh_minmax(me, min, max)) {
2329                 mid_v3_v3v3(r_cent, min, max);
2330                 return true;
2331         }
2332
2333         return false;
2334 }
2335
2336 bool BKE_mesh_center_of_surface(const Mesh *me, float r_cent[3])
2337 {
2338         int i = me->totpoly;
2339         MPoly *mpoly;
2340         float poly_area;
2341         float total_area = 0.0f;
2342         float poly_cent[3];
2343
2344         zero_v3(r_cent);
2345
2346         /* calculate a weighted average of polygon centroids */
2347         for (mpoly = me->mpoly; i--; mpoly++) {
2348                 poly_area = mesh_calc_poly_area_centroid(mpoly, me->mloop + mpoly->loopstart, me->mvert, poly_cent);
2349
2350                 madd_v3_v3fl(r_cent, poly_cent, poly_area);
2351                 total_area += poly_area;
2352         }
2353         /* otherwise we get NAN for 0 polys */
2354         if (me->totpoly) {
2355                 mul_v3_fl(r_cent, 1.0f / total_area);
2356         }
2357
2358         /* zero area faces cause this, fallback to median */
2359         if (UNLIKELY(!is_finite_v3(r_cent))) {
2360                 return BKE_mesh_center_median(me, r_cent);
2361         }
2362
2363         return (me->totpoly != 0);
2364 }
2365
2366 /**
2367  * \note Mesh must be manifold with consistent face-winding, see #mesh_calc_poly_volume_centroid for details.
2368  */
2369 bool BKE_mesh_center_of_volume(const Mesh *me, float r_cent[3])
2370 {
2371         int i = me->totpoly;
2372         MPoly *mpoly;
2373         float poly_volume;
2374         float total_volume = 0.0f;
2375         float poly_cent[3];
2376
2377         zero_v3(r_cent);
2378
2379         /* calculate a weighted average of polyhedron centroids */
2380         for (mpoly = me->mpoly; i--; mpoly++) {
2381                 poly_volume = mesh_calc_poly_volume_centroid(mpoly, me->mloop + mpoly->loopstart, me->mvert, poly_cent);
2382
2383                 /* poly_cent is already volume-weighted, so no need to multiply by the volume */
2384                 add_v3_v3(r_cent, poly_cent);
2385                 total_volume += poly_volume;
2386         }
2387         /* otherwise we get NAN for 0 polys */
2388         if (total_volume != 0.0f) {
2389                 /* multipy by 0.25 to get the correct centroid */
2390                 /* no need to divide volume by 6 as the centroid is weighted by 6x the volume, so it all cancels out */
2391                 mul_v3_fl(r_cent, 0.25f / total_volume);
2392         }
2393
2394         /* this can happen for non-manifold objects, fallback to median */
2395         if (UNLIKELY(!is_finite_v3(r_cent))) {
2396                 return BKE_mesh_center_median(me, r_cent);
2397         }
2398
2399         return (me->totpoly != 0);
2400 }
2401
2402 /** \} */
2403
2404
2405 /* -------------------------------------------------------------------- */
2406
2407 /** \name Mesh Volume Calculation
2408  * \{ */
2409
2410 static bool mesh_calc_center_centroid_ex(
2411         const MVert *mverts, int UNUSED(mverts_num),
2412         const MLoopTri *looptri, int looptri_num,
2413         const MLoop *mloop, float r_center[3])
2414 {
2415         const MLoopTri *lt;
2416         float totweight;
2417         int i;
2418         
2419         zero_v3(r_center);
2420         
2421         if (looptri_num == 0)
2422                 return false;
2423         
2424         totweight = 0.0f;
2425         for (i = 0, lt = looptri; i < looptri_num; i++, lt++) {
2426                 const MVert *v1 = &mverts[mloop[lt->tri[0]].v];
2427                 const MVert *v2 = &mverts[mloop[lt->tri[1]].v];
2428                 const MVert *v3 = &mverts[mloop[lt->tri[2]].v];
2429                 float area;
2430                 
2431                 area = area_tri_v3(v1->co, v2->co, v3->co);
2432                 madd_v3_v3fl(r_center, v1->co, area);
2433                 madd_v3_v3fl(r_center, v2->co, area);
2434                 madd_v3_v3fl(r_center, v3->co, area);
2435                 totweight += area;
2436         }
2437         if (totweight == 0.0f)
2438                 return false;
2439         
2440         mul_v3_fl(r_center, 1.0f / (3.0f * totweight));
2441         
2442         return true;
2443 }
2444
2445 /**
2446  * Calculate the volume and center.
2447  *
2448  * \param r_volume: Volume (unsigned).
2449  * \param r_center: Center of mass.
2450  */
2451 void BKE_mesh_calc_volume(
2452         const MVert *mverts, const int mverts_num,
2453         const MLoopTri *looptri, const int looptri_num,
2454         const MLoop *mloop,
2455         float *r_volume, float r_center[3])
2456 {
2457         const MLoopTri *lt;
2458         float center[3];
2459         float totvol;
2460         int i;
2461         
2462         if (r_volume)
2463                 *r_volume = 0.0f;
2464         if (r_center)
2465                 zero_v3(r_center);
2466         
2467         if (looptri_num == 0)
2468                 return;
2469         
2470         if (!mesh_calc_center_centroid_ex(mverts, mverts_num, looptri, looptri_num, mloop, center))
2471                 return;
2472         
2473         totvol = 0.0f;
2474
2475         for (i = 0, lt = looptri; i < looptri_num; i++, lt++) {
2476                 const MVert *v1 = &mverts[mloop[lt->tri[0]].v];
2477                 const MVert *v2 = &mverts[mloop[lt->tri[1]].v];
2478                 const MVert *v3 = &mverts[mloop[lt->tri[2]].v];
2479                 float vol;
2480                 
2481                 vol = volume_tetrahedron_signed_v3(center, v1->co, v2->co, v3->co);
2482                 if (r_volume) {
2483                         totvol += vol;
2484                 }
2485                 if (r_center) {
2486                         /* averaging factor 1/3 is applied in the end */
2487                         madd_v3_v3fl(r_center, v1->co, vol);
2488                         madd_v3_v3fl(r_center, v2->co, vol);
2489                         madd_v3_v3fl(r_center, v3->co, vol);
2490                 }
2491         }
2492         
2493         /* Note: Depending on arbitrary centroid position,
2494          * totvol can become negative even for a valid mesh.
2495          * The true value is always the positive value.
2496          */
2497         if (r_volume) {
2498                 *r_volume = fabsf(totvol);
2499         }
2500         if (r_center) {
2501                 /* Note: Factor 1/3 is applied once for all vertices here.
2502                  * This also automatically negates the vector if totvol is negative.
2503                  */
2504                 if (totvol != 0.0f)
2505                         mul_v3_fl(r_center, (1.0f / 3.0f) / totvol);
2506         }
2507 }
2508
2509
2510 /* -------------------------------------------------------------------- */
2511
2512 /** \name NGon Tessellation (NGon/Tessface Conversion)
2513  * \{ */
2514
2515 /**
2516  * Convert a triangle or quadrangle of loop/poly data to tessface data
2517  */
2518 void BKE_mesh_loops_to_mface_corners(
2519         CustomData *fdata, CustomData *ldata,
2520         CustomData *pdata, unsigned int lindex[4], int findex,
2521         const int polyindex,
2522         const int mf_len, /* 3 or 4 */
2523
2524         /* cache values to avoid lookups every time */
2525         const int numTex, /* CustomData_number_of_layers(pdata, CD_MTEXPOLY) */
2526         const int numCol, /* CustomData_number_of_layers(ldata, CD_MLOOPCOL) */
2527         const bool hasPCol, /* CustomData_has_layer(ldata, CD_PREVIEW_MLOOPCOL) */
2528         const bool hasOrigSpace, /* CustomData_has_layer(ldata, CD_ORIGSPACE_MLOOP) */
2529         const bool hasLNor /* CustomData_has_layer(ldata, CD_NORMAL) */
2530 )
2531 {
2532         MTFace *texface;
2533         MTexPoly *texpoly;
2534         MCol *mcol;
2535         MLoopCol *mloopcol;
2536         MLoopUV *mloopuv;
2537         int i, j;
2538
2539         for (i = 0; i < numTex; i++) {
2540                 texface = CustomData_get_n(fdata, CD_MTFACE, findex, i);
2541                 texpoly = CustomData_get_n(pdata, CD_MTEXPOLY, polyindex, i);
2542
2543                 ME_MTEXFACE_CPY(texface, texpoly);
2544
2545                 for (j = 0; j < mf_len; j++) {
2546                         mloopuv = CustomData_get_n(ldata, CD_MLOOPUV, (int)lindex[j], i);
2547                         copy_v2_v2(texface->uv[j], mloopuv->uv);
2548                 }
2549         }
2550
2551         for (i = 0; i < numCol; i++) {
2552                 mcol = CustomData_get_n(fdata, CD_MCOL, findex, i);
2553
2554                 for (j = 0; j < mf_len; j++) {
2555                         mloopcol = CustomData_get_n(ldata, CD_MLOOPCOL, (int)lindex[j], i);
2556                         MESH_MLOOPCOL_TO_MCOL(mloopcol, &mcol[j]);
2557                 }
2558         }
2559
2560         if (hasPCol) {
2561                 mcol = CustomData_get(fdata,  findex, CD_PREVIEW_MCOL);
2562
2563                 for (j = 0; j < mf_len; j++) {
2564                         mloopcol = CustomData_get(ldata, (int)lindex[j], CD_PREVIEW_MLOOPCOL);
2565                         MESH_MLOOPCOL_TO_MCOL(mloopcol, &mcol[j]);
2566                 }
2567         }
2568
2569         if (hasOrigSpace) {
2570                 OrigSpaceFace *of = CustomData_get(fdata, findex, CD_ORIGSPACE);
2571                 OrigSpaceLoop *lof;
2572
2573                 for (j = 0; j < mf_len; j++) {
2574                         lof = CustomData_get(ldata, (int)lindex[j], CD_ORIGSPACE_MLOOP);
2575                         copy_v2_v2(of->uv[j], lof->uv);
2576                 }
2577         }
2578
2579         if (hasLNor) {
2580                 short (*tlnors)[3] = CustomData_get(fdata, findex, CD_TESSLOOPNORMAL);
2581
2582                 for (j = 0; j < mf_len; j++) {
2583                         normal_float_to_short_v3(tlnors[j], CustomData_get(ldata, (int)lindex[j], CD_NORMAL));
2584                 }
2585         }
2586 }
2587
2588 /**
2589  * Convert all CD layers from loop/poly to tessface data.
2590  *
2591  * \param loopindices is an array of an int[4] per tessface, mapping tessface's verts to loops indices.
2592  *
2593  * \note when mface is not NULL, mface[face_index].v4 is used to test quads, else, loopindices[face_index][3] is used.
2594  */
2595 void BKE_mesh_loops_to_tessdata(CustomData *fdata, CustomData *ldata, CustomData *pdata, MFace *mface,
2596                                 int *polyindices, unsigned int (*loopindices)[4], const int num_faces)
2597 {
2598         /* Note: performances are sub-optimal when we get a NULL mface, we could be ~25% quicker with dedicated code...
2599          *       Issue is, unless having two different functions with nearly the same code, there's not much ways to solve
2600          *       this. Better imho to live with it for now. :/ --mont29
2601          */
2602         const int numTex = CustomData_number_of_layers(pdata, CD_MTEXPOLY);
2603         const int numCol = CustomData_number_of_layers(ldata, CD_MLOOPCOL);
2604         const bool hasPCol = CustomData_has_layer(ldata, CD_PREVIEW_MLOOPCOL);
2605         const bool hasOrigSpace = CustomData_has_layer(ldata, CD_ORIGSPACE_MLOOP);
2606         const bool hasLoopNormal = CustomData_has_layer(ldata, CD_NORMAL);
2607         const bool hasLoopTangent = CustomData_has_layer(ldata, CD_TANGENT);
2608         int findex, i, j;
2609         const int *pidx;
2610         unsigned int (*lidx)[4];
2611
2612         for (i = 0; i < numTex; i++) {
2613                 MTFace *texface = CustomData_get_layer_n(fdata, CD_MTFACE, i);
2614                 MTexPoly *texpoly = CustomData_get_layer_n(pdata, CD_MTEXPOLY, i);
2615                 MLoopUV *mloopuv = CustomData_get_layer_n(ldata, CD_MLOOPUV, i);
2616
2617                 for (findex = 0, pidx = polyindices, lidx = loopindices;
2618                      findex < num_faces;
2619                      pidx++, lidx++, findex++, texface++)
2620                 {
2621                         ME_MTEXFACE_CPY(texface, &texpoly[*pidx]);
2622
2623                         for (j = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3; j--;) {
2624                                 copy_v2_v2(texface->uv[j], mloopuv[(*lidx)[j]].uv);
2625                         }
2626                 }
2627         }
2628
2629         for (i = 0; i < numCol; i++) {
2630                 MCol (*mcol)[4] = CustomData_get_layer_n(fdata, CD_MCOL, i);
2631                 MLoopCol *mloopcol = CustomData_get_layer_n(ldata, CD_MLOOPCOL, i);
2632
2633                 for (findex = 0, lidx = loopindices; findex < num_faces; lidx++, findex++, mcol++) {
2634                         for (j = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3; j--;) {
2635                                 MESH_MLOOPCOL_TO_MCOL(&mloopcol[(*lidx)[j]], &(*mcol)[j]);
2636                         }
2637                 }
2638         }
2639
2640         if (hasPCol) {
2641                 MCol (*mcol)[4] = CustomData_get_layer(fdata, CD_PREVIEW_MCOL);
2642                 MLoopCol *mloopcol = CustomData_get_layer(ldata, CD_PREVIEW_MLOOPCOL);
2643
2644                 for (findex = 0, lidx = loopindices; findex < num_faces; lidx++, findex++, mcol++) {
2645                         for (j = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3; j--;) {
2646                                 MESH_MLOOPCOL_TO_MCOL(&mloopcol[(*lidx)[j]], &(*mcol)[j]);
2647                         }
2648                 }
2649         }
2650
2651         if (hasOrigSpace) {
2652                 OrigSpaceFace *of = CustomData_get_layer(fdata, CD_ORIGSPACE);
2653                 OrigSpaceLoop *lof = CustomData_get_layer(ldata, CD_ORIGSPACE_MLOOP);
2654
2655                 for (findex = 0, lidx = loopindices; findex < num_faces; lidx++, findex++, of++) {
2656                         for (j = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3; j--;) {
2657                                 copy_v2_v2(of->uv[j], lof[(*lidx)[j]].uv);
2658                         }
2659                 }
2660         }
2661
2662         if (hasLoopNormal) {
2663                 short (*fnors)[4][3] = CustomData_get_layer(fdata, CD_TESSLOOPNORMAL);
2664                 float (*lnors)[3] = CustomData_get_layer(ldata, CD_NORMAL);
2665
2666                 for (findex = 0, lidx = loopindices; findex < num_faces; lidx++, findex++, fnors++) {
2667                         for (j = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3; j--;) {
2668                                 normal_float_to_short_v3((*fnors)[j], lnors[(*lidx)[j]]);
2669                         }
2670                 }
2671         }
2672
2673         if (hasLoopTangent) {
2674                 /* need to do for all uv maps at some point */
2675                 float (*ftangents)[4] = CustomData_get_layer(fdata, CD_TANGENT);
2676                 float (*ltangents)[4] = CustomData_get_layer(ldata, CD_TANGENT);
2677
2678                 for (findex = 0, pidx = polyindices, lidx = loopindices;
2679                      findex < num_faces;
2680                      pidx++, lidx++, findex++)
2681                 {
2682                         int nverts = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3;
2683                         for (j = nverts; j--;) {
2684                                 copy_v4_v4(ftangents[findex * 4 + j], ltangents[(*lidx)[j]]);
2685                         }
2686                 }
2687         }
2688 }
2689
2690 void BKE_mesh_tangent_loops_to_tessdata(
2691         CustomData *fdata, CustomData *ldata, MFace *mface,
2692         int *polyindices, unsigned int (*loopindices)[4], const int num_faces, const char *layer_name)
2693 {
2694         /* Note: performances are sub-optimal when we get a NULL mface, we could be ~25% quicker with dedicated code...
2695          *       Issue is, unless having two different functions with nearly the same code, there's not much ways to solve
2696          *       this. Better imho to live with it for now. :/ --mont29
2697          */
2698
2699         float (*ftangents)[4] = NULL;
2700         float (*ltangents)[4] = NULL;
2701
2702         int findex, j;
2703         const int *pidx;
2704         unsigned int (*lidx)[4];
2705
2706         if (layer_name)
2707                 ltangents = CustomData_get_layer_named(ldata, CD_TANGENT, layer_name);
2708         else
2709                 ltangents = CustomData_get_layer(ldata, CD_TANGENT);
2710
2711         if (ltangents) {
2712                 /* need to do for all uv maps at some point */
2713                 if (layer_name)
2714                         ftangents = CustomData_get_layer_named(fdata, CD_TANGENT, layer_name);
2715                 else
2716                         ftangents = CustomData_get_layer(fdata, CD_TANGENT);
2717                 if (ftangents) {
2718                         for (findex = 0, pidx = polyindices, lidx = loopindices;
2719                              findex < num_faces;
2720                              pidx++, lidx++, findex++)
2721                         {
2722                                 int nverts = (mface ? mface[findex].v4 : (*lidx)[3]) ? 4 : 3;
2723                                 for (j = nverts; j--;) {
2724                                         copy_v4_v4(ftangents[findex * 4 + j], ltangents[(*lidx)[j]]);
2725                                 }
2726                         }
2727                 }
2728         }
2729 }
2730
2731 /**
2732  * Recreate tessellation.
2733  *
2734  * \param do_face_nor_copy: Controls whether the normals from the poly are copied to the tessellated faces.
2735  *
2736  * \return number of tessellation faces.
2737  */
2738 int BKE_mesh_recalc_tessellation(
2739         CustomData *fdata, CustomData *ldata, CustomData *pdata,
2740         MVert *mvert,
2741         int totface, int totloop, int totpoly,
2742         const bool do_face_nor_copy)
2743 {
2744         /* use this to avoid locking pthread for _every_ polygon
2745          * and calling the fill function */
2746
2747 #define USE_TESSFACE_SPEEDUP
2748 #define USE_TESSFACE_QUADS  /* NEEDS FURTHER TESTING */
2749
2750 /* We abuse MFace->edcode to tag quad faces. See below for details. */
2751 #define TESSFACE_IS_QUAD 1
2752
2753         const int looptri_num = poly_to_tri_count(totpoly, totloop);
2754
2755         MPoly *mp, *mpoly;
2756         MLoop *ml, *mloop;
2757         MFace *mface, *mf;
2758         MemArena *arena = NULL;
2759         int *mface_to_poly_map;
2760         unsigned int (*lindices)[4];
2761         int poly_index, mface_index;
2762         unsigned int j;
2763
2764         mpoly = CustomData_get_layer(pdata, CD_MPOLY);
2765         mloop = CustomData_get_layer(ldata, CD_MLOOP);
2766
2767         /* allocate the length of totfaces, avoid many small reallocs,
2768          * if all faces are tri's it will be correct, quads == 2x allocs */
2769         /* take care. we are _not_ calloc'ing so be sure to initialize each field */
2770         mface_to_poly_map = MEM_malloc_arrayN((size_t)looptri_num, sizeof(*mface_to_poly_map), __func__);
2771         mface             = MEM_malloc_arrayN((size_t)looptri_num, sizeof(*mface), __func__);
2772         lindices          = MEM_malloc_arrayN((size_t)looptri_num, sizeof(*lindices), __func__);
2773
2774         mface_index = 0;
2775         mp = mpoly;
2776         for (poly_index = 0; poly_index < totpoly; poly_index++, mp++) {
2777                 const unsigned int mp_loopstart = (unsigned int)mp->loopstart;
2778                 const unsigned int mp_totloop = (unsigned int)mp->totloop;
2779                 unsigned int l1, l2, l3, l4;
2780                 unsigned int *lidx;
2781                 if (mp_totloop < 3) {
2782                         /* do nothing */
2783                 }
2784
2785 #ifdef USE_TESSFACE_SPEEDUP
2786
2787 #define ML_TO_MF(i1, i2, i3)                                                  \
2788                 mface_to_poly_map[mface_index] = poly_index;                          \
2789                 mf = &mface[mface_index];                                             \
2790                 lidx = lindices[mface_index];                                         \
2791                 /* set loop indices, transformed to vert indices later */             \
2792                 l1 = mp_loopstart + i1;                                               \
2793                 l2 = mp_loopstart + i2;                                               \
2794                 l3 = mp_loopstart + i3;                                               \
2795                 mf->v1 = mloop[l1].v;                                                 \
2796                 mf->v2 = mloop[l2].v;                                                 \
2797                 mf->v3 = mloop[l3].v;                                                 \
2798                 mf->v4 = 0;                                                           \
2799                 lidx[0] = l1;                                                         \
2800                 lidx[1] = l2;                                                         \
2801                 lidx[2] = l3;                                                         \
2802                 lidx[3] = 0;                                                          \
2803                 mf->mat_nr = mp->mat_nr;                                              \
2804                 mf->flag = mp->flag;                                                  \
2805                 mf->edcode = 0;                                                       \
2806                 (void)0
2807
2808 /* ALMOST IDENTICAL TO DEFINE ABOVE (see EXCEPTION) */
2809 #define ML_TO_MF_QUAD()                                                       \
2810                 mface_to_poly_map[mface_index] = poly_index;                          \
2811                 mf = &mface[mface_index];                                             \
2812                 lidx = lindices[mface_index];                                         \
2813                 /* set loop indices, transformed to vert indices later */             \
2814                 l1 = mp_loopstart + 0; /* EXCEPTION */                                \
2815                 l2 = mp_loopstart + 1; /* EXCEPTION */                                \
2816                 l3 = mp_loopstart + 2; /* EXCEPTION */                                \
2817                 l4 = mp_loopstart + 3; /* EXCEPTION */                                \
2818                 mf->v1 = mloop[l1].v;                                                 \
2819                 mf->v2 = mloop[l2].v;                                                 \
2820                 mf->v3 = mloop[l3].v;                                                 \
2821                 mf->v4 = mloop[l4].v;                                                 \
2822                 lidx[0] = l1;                                                         \
2823                 lidx[1] = l2;                                                         \
2824                 lidx[2] = l3;                                                         \
2825                 lidx[3] = l4;                                                         \
2826                 mf->mat_nr = mp->mat_nr;                                              \
2827                 mf->flag = mp->flag;                                                  \
2828                 mf->edcode = TESSFACE_IS_QUAD;                                        \
2829                 (void)0
2830
2831
2832                 else if (mp_totloop == 3) {
2833                         ML_TO_MF(0, 1, 2);
2834                         mface_index++;
2835                 }
2836                 else if (mp_totloop == 4) {
2837 #ifdef USE_TESSFACE_QUADS
2838                         ML_TO_MF_QUAD();
2839                         mface_index++;
2840 #else
2841                         ML_TO_MF(0, 1, 2);
2842                         mface_index++;
2843                         ML_TO_MF(0, 2, 3);
2844                         mface_index++;
2845 #endif
2846                 }
2847 #endif /* USE_TESSFACE_SPEEDUP */
2848                 else {
2849                         const float *co_curr, *co_prev;
2850
2851                         float normal[3];
2852
2853                         float axis_mat[3][3];
2854                         float (*projverts)[2];
2855                         unsigned int (*tris)[3];
2856
2857                         const unsigned int totfilltri = mp_totloop - 2;
2858
2859                         if (UNLIKELY(arena == NULL)) {
2860                                 arena = BLI_memarena_new(BLI_MEMARENA_STD_BUFSIZE, __func__);
2861                         }
2862
2863                         tris = BLI_memarena_alloc(arena, sizeof(*tris) * (size_t)totfilltri);
2864                         projverts = BLI_memarena_alloc(arena, sizeof(*projverts) * (size_t)mp_totloop);
2865
2866                         zero_v3(normal);
2867
2868                         /* calc normal, flipped: to get a positive 2d cross product */
2869                         ml = mloop + mp_loopstart;
2870                         co_prev = mvert[ml[mp_totloop - 1].v].co;
2871                         for (j = 0; j < mp_totloop; j++, ml++) {
2872                                 co_curr = mvert[ml->v].co;
2873                                 add_newell_cross_v3_v3v3(normal, co_prev, co_curr);
2874                                 co_prev = co_curr;
2875                         }
2876                         if (UNLIKELY(normalize_v3(normal) == 0.0f)) {
2877                                 normal[2] = 1.0f;
2878                         }
2879
2880                         /* project verts to 2d */
2881                         axis_dominant_v3_to_m3_negate(axis_mat, normal);
2882
2883                         ml = mloop + mp_loopstart;
2884                         for (j = 0; j < mp_totloop; j++, ml++) {
2885                                 mul_v2_m3v3(projverts[j], axis_mat, mvert[ml->v].co);
2886                         }
2887
2888                         BLI_polyfill_calc_arena(projverts, mp_totloop, 1, tris, arena);
2889
2890                         /* apply fill */
2891                         for (j = 0; j < totfilltri; j++) {
2892                                 unsigned int *tri = tris[j];
2893                                 lidx = lindices[mface_index];
2894
2895                                 mface_to_poly_map[mface_index] = poly_index;
2896                                 mf = &mface[mface_index];
2897
2898                                 /* set loop indices, transformed to vert indices later */
2899                                 l1 = mp_loopstart + tri[0];
2900                                 l2 = mp_loopstart + tri[1];
2901                                 l3 = mp_loopstart + tri[2];
2902
2903                                 mf->v1 = mloop[l1].v;
2904                                 mf->v2 = mloop[l2].v;
2905                                 mf->v3 = mloop[l3].v;
2906                                 mf->v4 = 0;
2907
2908                                 lidx[0] = l1;
2909                                 lidx[1] = l2;
2910                                 lidx[2] = l3;
2911                                 lidx[3] = 0;
2912
2913                                 mf->mat_nr = mp->mat_nr;
2914                                 mf->flag = mp->flag;
2915                                 mf->edcode = 0;
2916
2917                                 mface_index++;
2918                         }
2919
2920                         BLI_memarena_clear(arena);
2921                 }
2922         }
2923
2924         if (arena) {
2925                 BLI_memarena_free(arena);
2926                 arena = NULL;
2927         }
2928
2929         CustomData_free(fdata, totface);
2930         totface = mface_index;
2931
2932         BLI_assert(totface <= looptri_num);
2933
2934         /* not essential but without this we store over-alloc'd memory in the CustomData layers */
2935         if (LIKELY(looptri_num != totface)) {
2936                 mface = MEM_reallocN(mface, sizeof(*mface) * (size_t)totface);
2937                 mface_to_poly_map = MEM_reallocN(mface_to_poly_map, sizeof(*mface_to_poly_map) * (size_t)totface);
2938         }
2939
2940         CustomData_add_layer(fdata, CD_MFACE, CD_ASSIGN, mface, totface);
2941
2942         /* CD_ORIGINDEX will contain an array of indices from tessfaces to the polygons
2943          * they are directly tessellated from */
2944         CustomData_add_layer(fdata, CD_ORIGINDEX, CD_ASSIGN, mface_to_poly_map, totface);
2945         CustomData_from_bmeshpoly(fdata, pdata, ldata, totface);
2946
2947         if (do_face_nor_copy) {
2948                 /* If polys have a normals layer, copying that to faces can help
2949                  * avoid the need to recalculate normals later */
2950                 if (CustomData_has_layer(pdata, CD_NORMAL)) {
2951                         float (*pnors)[3] = CustomData_get_layer(pdata, CD_NORMAL);
2952                         float (*fnors)[3] = CustomData_add_layer(fdata, CD_NORMAL, CD_CALLOC, NULL, totface);
2953                         for (mface_index = 0; mface_index < totface; mface_index++) {
2954                                 copy_v3_v3(fnors[mface_index], pnors[mface_to_poly_map[mface_index]]);
2955                         }
2956                 }
2957         }
2958
2959         /* NOTE: quad detection issue - fourth vertidx vs fourth loopidx:
2960          * Polygons take care of their loops ordering, hence not of their vertices ordering.
2961          * Currently, our tfaces' fourth vertex index might be 0 even for a quad. However, we know our fourth loop index is
2962          * never 0 for quads (because they are sorted for polygons, and our quads are still mere copies of their polygons).
2963          * So we pass NULL as MFace pointer, and BKE_mesh_loops_to_tessdata will use the fourth loop index as quad test.
2964          * ...
2965          */
2966         BKE_mesh_loops_to_tessdata(fdata, ldata, pdata, NULL, mface_to_poly_map, lindices, totface);
2967
2968         /* NOTE: quad detection issue - fourth vertidx vs fourth loopidx:
2969          * ...However, most TFace code uses 'MFace->v4 == 0' test to check whether it is a tri or quad.
2970          * test_index_face() will check this and rotate the tessellated face if needed.
2971          */
2972 #ifdef USE_TESSFACE_QUADS
2973         mf = mface;
2974         for (mface_index = 0; mface_index < totface; mface_index++, mf++) {
2975                 if (mf->edcode == TESSFACE_IS_QUAD) {
2976                         test_index_face(mf, fdata, mface_index, 4);
2977                         mf->edcode = 0;
2978                 }
2979         }
2980 #endif
2981
2982         MEM_freeN(lindices);
2983
2984         return totface;
2985
2986 #undef USE_TESSFACE_SPEEDUP
2987 #undef USE_TESSFACE_QUADS
2988
2989 #undef ML_TO_MF
2990 #undef ML_TO_MF_QUAD
2991
2992 }
2993
2994 /**
2995  * Calculate tessellation into #MLoopTri which exist only for this purpose.
2996  */
2997 void BKE_mesh_recalc_looptri(
2998         const MLoop *mloop, const MPoly *mpoly,
2999         const MVert *mvert,
3000         int totloop, int totpoly,
3001         MLoopTri *mlooptri)
3002 {
3003         /* use this to avoid locking pthread for _every_ polygon
3004          * and calling the fill function */
3005
3006 #define USE_TESSFACE_SPEEDUP
3007
3008         const MPoly *mp;
3009         const MLoop *ml;
3010         MLoopTri *mlt;
3011         MemArena *arena = NULL;
3012         int poly_index, mlooptri_index;
3013         unsigned int j;
3014
3015         mlooptri_index = 0;
3016         mp = mpoly;
3017         for (poly_index = 0; poly_index < totpoly; poly_index++, mp++) {
3018                 const unsigned int mp_loopstart = (unsigned int)mp->loopstart;
3019                 const unsigned int mp_totloop = (unsigned int)mp->totloop;
3020                 unsigned int l1, l2, l3;
3021                 if (mp_totloop < 3) {
3022                         /* do nothing */
3023                 }
3024
3025 #ifdef USE_TESSFACE_SPEEDUP
3026
3027 #define ML_TO_MLT(i1, i2, i3)  { \
3028                         mlt = &mlooptri[mlooptri_index]; \
3029                         l1 = mp_loopstart + i1; \
3030                         l2 = mp_loopstart + i2; \
3031                         l3 = mp_loopstart + i3; \
3032                         ARRAY_SET_ITEMS(mlt->tri, l1, l2, l3); \
3033                         mlt->poly = (unsigned int)poly_index; \
3034                 } ((void)0)
3035
3036                 else if (mp_totloop == 3) {
3037                         ML_TO_MLT(0, 1, 2);
3038                         mlooptri_index++;
3039                 }
3040                 else if (mp_totloop == 4) {
3041                         ML_TO_MLT(0, 1, 2);
3042                         MLoopTri *mlt_a = mlt;
3043                         mlooptri_index++;
3044                         ML_TO_MLT(0, 2, 3);
3045                         MLoopTri *mlt_b = mlt;
3046                         mlooptri_index++;
3047
3048                         if (UNLIKELY(is_quad_flip_v3_first_third_fast(
3049                                              mvert[mloop[mlt_a->tri[0]].v].co,