Fix Cycles OpenCL compiler error after recent changes.
[blender-staging.git] / intern / cycles / kernel / kernel_types.h
1 /*
2  * Copyright 2011-2013 Blender Foundation
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef __KERNEL_TYPES_H__
18 #define __KERNEL_TYPES_H__
19
20 #include "kernel/kernel_math.h"
21 #include "kernel/svm/svm_types.h"
22 #include "util/util_static_assert.h"
23
24 #ifndef __KERNEL_GPU__
25 #  define __KERNEL_CPU__
26 #endif
27
28 /* TODO(sergey): This is only to make it possible to include this header
29  * from outside of the kernel. but this could be done somewhat cleaner?
30  */
31 #ifndef ccl_addr_space
32 #  define ccl_addr_space
33 #endif
34
35 CCL_NAMESPACE_BEGIN
36
37 /* constants */
38 #define OBJECT_SIZE             12
39 #define OBJECT_VECTOR_SIZE      6
40 #define LIGHT_SIZE              11
41 #define FILTER_TABLE_SIZE       1024
42 #define RAMP_TABLE_SIZE         256
43 #define SHUTTER_TABLE_SIZE              256
44 #define PARTICLE_SIZE           5
45 #define SHADER_SIZE             5
46
47 #define BSSRDF_MIN_RADIUS                       1e-8f
48 #define BSSRDF_MAX_HITS                         4
49
50 #define BECKMANN_TABLE_SIZE             256
51
52 #define SHADER_NONE                             (~0)
53 #define OBJECT_NONE                             (~0)
54 #define PRIM_NONE                               (~0)
55 #define LAMP_NONE                               (~0)
56
57 #define VOLUME_STACK_SIZE               16
58
59 #define WORK_POOL_SIZE_GPU 64
60 #define WORK_POOL_SIZE_CPU 1
61 #ifdef __KERNEL_GPU__
62 #  define WORK_POOL_SIZE WORK_POOL_SIZE_GPU
63 #else
64 #  define WORK_POOL_SIZE WORK_POOL_SIZE_CPU
65 #endif
66
67
68 #define SHADER_SORT_BLOCK_SIZE 2048
69
70 #ifdef __KERNEL_OPENCL__
71 #  define SHADER_SORT_LOCAL_SIZE 64
72 #elif defined(__KERNEL_CUDA__)
73 #  define SHADER_SORT_LOCAL_SIZE 32
74 #else
75 #  define SHADER_SORT_LOCAL_SIZE 1
76 #endif
77
78
79 /* device capabilities */
80 #ifdef __KERNEL_CPU__
81 #  ifdef __KERNEL_SSE2__
82 #    define __QBVH__
83 #  endif
84 #  define __KERNEL_SHADING__
85 #  define __KERNEL_ADV_SHADING__
86 #  define __BRANCHED_PATH__
87 #  ifdef WITH_OSL
88 #    define __OSL__
89 #  endif
90 #  define __PRINCIPLED__
91 #  define __SUBSURFACE__
92 #  define __CMJ__
93 #  define __VOLUME__
94 #  define __VOLUME_SCATTER__
95 #  define __SHADOW_RECORD_ALL__
96 #  define __VOLUME_DECOUPLED__
97 #  define __VOLUME_RECORD_ALL__
98 #endif  /* __KERNEL_CPU__ */
99
100 #ifdef __KERNEL_CUDA__
101 #  define __KERNEL_SHADING__
102 #  define __KERNEL_ADV_SHADING__
103 #  define __VOLUME__
104 #  define __VOLUME_SCATTER__
105 #  define __SUBSURFACE__
106 #  define __PRINCIPLED__
107 #  define __SHADOW_RECORD_ALL__
108 #  define __CMJ__
109 #  ifndef __SPLIT_KERNEL__
110 #    define __BRANCHED_PATH__
111 #  endif
112 #endif  /* __KERNEL_CUDA__ */
113
114 #ifdef __KERNEL_OPENCL__
115
116 /* keep __KERNEL_ADV_SHADING__ in sync with opencl_kernel_use_advanced_shading! */
117
118 #  ifdef __KERNEL_OPENCL_NVIDIA__
119 #    define __KERNEL_SHADING__
120 #    define __KERNEL_ADV_SHADING__
121 #    define __SUBSURFACE__
122 #    define __PRINCIPLED__
123 #    define __VOLUME__
124 #    define __VOLUME_SCATTER__
125 #    define __SHADOW_RECORD_ALL__
126 #    define __CMJ__
127 #    define __BRANCHED_PATH__
128 #  endif  /* __KERNEL_OPENCL_NVIDIA__ */
129
130 #  ifdef __KERNEL_OPENCL_APPLE__
131 #    define __KERNEL_SHADING__
132 #    define __KERNEL_ADV_SHADING__
133 #    define __PRINCIPLED__
134 #    define __CMJ__
135 /* TODO(sergey): Currently experimental section is ignored here,
136  * this is because megakernel in device_opencl does not support
137  * custom cflags depending on the scene features.
138  */
139 #  endif  /* __KERNEL_OPENCL_APPLE__ */
140
141 #  ifdef __KERNEL_OPENCL_AMD__
142 #    define __CL_USE_NATIVE__
143 #    define __KERNEL_SHADING__
144 #    define __KERNEL_ADV_SHADING__
145 #    define __SUBSURFACE__
146 #    define __PRINCIPLED__
147 #    define __VOLUME__
148 #    define __VOLUME_SCATTER__
149 #    define __SHADOW_RECORD_ALL__
150 #    define __CMJ__
151 #    define __BRANCHED_PATH__
152 #  endif  /* __KERNEL_OPENCL_AMD__ */
153
154 #  ifdef __KERNEL_OPENCL_INTEL_CPU__
155 #    define __CL_USE_NATIVE__
156 #    define __KERNEL_SHADING__
157 #    define __KERNEL_ADV_SHADING__
158 #    define __PRINCIPLED__
159 #    define __CMJ__
160 #  endif  /* __KERNEL_OPENCL_INTEL_CPU__ */
161
162 #endif  /* __KERNEL_OPENCL__ */
163
164 /* kernel features */
165 #define __SOBOL__
166 #define __INSTANCING__
167 #define __DPDU__
168 #define __UV__
169 #define __BACKGROUND__
170 #define __CAUSTICS_TRICKS__
171 #define __VISIBILITY_FLAG__
172 #define __RAY_DIFFERENTIALS__
173 #define __CAMERA_CLIPPING__
174 #define __INTERSECTION_REFINE__
175 #define __CLAMP_SAMPLE__
176 #define __PATCH_EVAL__
177 #define __SHADOW_TRICKS__
178
179 #define __DENOISING_FEATURES__
180
181 #ifdef __KERNEL_SHADING__
182 #  define __SVM__
183 #  define __EMISSION__
184 #  define __TEXTURES__
185 #  define __EXTRA_NODES__
186 #  define __HOLDOUT__
187 #endif
188
189 #ifdef __KERNEL_ADV_SHADING__
190 #  define __MULTI_CLOSURE__
191 #  define __TRANSPARENT_SHADOWS__
192 #  define __PASSES__
193 #  define __BACKGROUND_MIS__
194 #  define __LAMP_MIS__
195 #  define __AO__
196 #  define __CAMERA_MOTION__
197 #  define __OBJECT_MOTION__
198 #  define __HAIR__
199 #  define __BAKING__
200 #endif
201
202 #ifdef WITH_CYCLES_DEBUG
203 #  define __KERNEL_DEBUG__
204 #endif
205
206 /* Scene-based selective features compilation. */
207 #ifdef __NO_CAMERA_MOTION__
208 #  undef __CAMERA_MOTION__
209 #endif
210 #ifdef __NO_OBJECT_MOTION__
211 #  undef __OBJECT_MOTION__
212 #endif
213 #ifdef __NO_HAIR__
214 #  undef __HAIR__
215 #endif
216 #ifdef __NO_VOLUME__
217 #  undef __VOLUME__
218 #  undef __VOLUME_SCATTER__
219 #endif
220 #ifdef __NO_SUBSURFACE__
221 #  undef __SUBSURFACE__
222 #endif
223 #ifdef __NO_BAKING__
224 #  undef __BAKING__
225 #endif
226 #ifdef __NO_BRANCHED_PATH__
227 #  undef __BRANCHED_PATH__
228 #endif
229 #ifdef __NO_PATCH_EVAL__
230 #  undef __PATCH_EVAL__
231 #endif
232 #ifdef __NO_TRANSPARENT__
233 #  undef __TRANSPARENT_SHADOWS__
234 #endif
235 #ifdef __NO_SHADOW_TRICKS__
236 #  undef __SHADOW_TRICKS__
237 #endif
238 #ifdef __NO_PRINCIPLED__
239 #  undef __PRINCIPLED__
240 #endif
241 #ifdef __NO_DENOISING__
242 #  undef __DENOISING_FEATURES__
243 #endif
244
245 /* Shader Evaluation */
246
247 typedef enum ShaderEvalType {
248         SHADER_EVAL_DISPLACE,
249         SHADER_EVAL_BACKGROUND,
250         /* bake types */
251         SHADER_EVAL_BAKE, /* no real shade, it's used in the code to
252                            * differentiate the type of shader eval from the above
253                            */
254         /* data passes */
255         SHADER_EVAL_NORMAL,
256         SHADER_EVAL_UV,
257         SHADER_EVAL_DIFFUSE_COLOR,
258         SHADER_EVAL_GLOSSY_COLOR,
259         SHADER_EVAL_TRANSMISSION_COLOR,
260         SHADER_EVAL_SUBSURFACE_COLOR,
261         SHADER_EVAL_EMISSION,
262
263         /* light passes */
264         SHADER_EVAL_AO,
265         SHADER_EVAL_COMBINED,
266         SHADER_EVAL_SHADOW,
267         SHADER_EVAL_DIFFUSE,
268         SHADER_EVAL_GLOSSY,
269         SHADER_EVAL_TRANSMISSION,
270         SHADER_EVAL_SUBSURFACE,
271
272         /* extra */
273         SHADER_EVAL_ENVIRONMENT,
274 } ShaderEvalType;
275
276 /* Path Tracing
277  * note we need to keep the u/v pairs at even values */
278
279 enum PathTraceDimension {
280         PRNG_FILTER_U = 0,
281         PRNG_FILTER_V = 1,
282         PRNG_LENS_U = 2,
283         PRNG_LENS_V = 3,
284         PRNG_TIME = 4,
285         PRNG_UNUSED_0 = 5,
286         PRNG_UNUSED_1 = 6,      /* for some reason (6, 7) is a bad sobol pattern */
287         PRNG_UNUSED_2 = 7,  /* with a low number of samples (< 64) */
288         PRNG_BASE_NUM = 10,
289
290         PRNG_BSDF_U = 0,
291         PRNG_BSDF_V = 1,
292         PRNG_LIGHT_U = 2,
293         PRNG_LIGHT_V = 3,
294         PRNG_LIGHT_TERMINATE = 4,
295         PRNG_TERMINATE = 5,
296         PRNG_PHASE_CHANNEL = 6,
297         PRNG_SCATTER_DISTANCE = 7,
298         PRNG_BOUNCE_NUM = 8,
299 };
300
301 enum SamplingPattern {
302         SAMPLING_PATTERN_SOBOL = 0,
303         SAMPLING_PATTERN_CMJ = 1,
304
305         SAMPLING_NUM_PATTERNS,
306 };
307
308 /* these flags values correspond to raytypes in osl.cpp, so keep them in sync! */
309
310 enum PathRayFlag {
311         PATH_RAY_CAMERA              = (1 << 0),
312         PATH_RAY_REFLECT             = (1 << 1),
313         PATH_RAY_TRANSMIT            = (1 << 2),
314         PATH_RAY_DIFFUSE             = (1 << 3),
315         PATH_RAY_GLOSSY              = (1 << 4),
316         PATH_RAY_SINGULAR            = (1 << 5),
317         PATH_RAY_TRANSPARENT         = (1 << 6),
318
319         PATH_RAY_SHADOW_OPAQUE_NON_CATCHER       = (1 << 7),
320         PATH_RAY_SHADOW_OPAQUE_CATCHER           = (1 << 8),
321         PATH_RAY_SHADOW_OPAQUE                   = (PATH_RAY_SHADOW_OPAQUE_NON_CATCHER|PATH_RAY_SHADOW_OPAQUE_CATCHER),
322         PATH_RAY_SHADOW_TRANSPARENT_NON_CATCHER  = (1 << 9),
323         PATH_RAY_SHADOW_TRANSPARENT_CATCHER      = (1 << 10),
324         PATH_RAY_SHADOW_TRANSPARENT              = (PATH_RAY_SHADOW_TRANSPARENT_NON_CATCHER|PATH_RAY_SHADOW_TRANSPARENT_CATCHER),
325         PATH_RAY_SHADOW_NON_CATCHER              = (PATH_RAY_SHADOW_OPAQUE_NON_CATCHER|PATH_RAY_SHADOW_TRANSPARENT_NON_CATCHER),
326         PATH_RAY_SHADOW                          = (PATH_RAY_SHADOW_OPAQUE|PATH_RAY_SHADOW_TRANSPARENT),
327
328         PATH_RAY_CURVE               = (1 << 11), /* visibility flag to define curve segments */
329         PATH_RAY_VOLUME_SCATTER      = (1 << 12), /* volume scattering */
330
331         /* Special flag to tag unaligned BVH nodes. */
332         PATH_RAY_NODE_UNALIGNED = (1 << 13),
333
334         PATH_RAY_ALL_VISIBILITY = ((1 << 14)-1),
335
336         PATH_RAY_MIS_SKIP            = (1 << 15),
337         PATH_RAY_DIFFUSE_ANCESTOR    = (1 << 16),
338         PATH_RAY_SINGLE_PASS_DONE    = (1 << 17),
339         PATH_RAY_SHADOW_CATCHER      = (1 << 18),
340         PATH_RAY_STORE_SHADOW_INFO   = (1 << 19),
341 };
342
343 /* Closure Label */
344
345 typedef enum ClosureLabel {
346         LABEL_NONE = 0,
347         LABEL_TRANSMIT = 1,
348         LABEL_REFLECT = 2,
349         LABEL_DIFFUSE = 4,
350         LABEL_GLOSSY = 8,
351         LABEL_SINGULAR = 16,
352         LABEL_TRANSPARENT = 32,
353         LABEL_VOLUME_SCATTER = 64,
354 } ClosureLabel;
355
356 /* Render Passes */
357
358 typedef enum PassType {
359         PASS_NONE = 0,
360         PASS_COMBINED = (1 << 0),
361         PASS_DEPTH = (1 << 1),
362         PASS_NORMAL = (1 << 2),
363         PASS_UV = (1 << 3),
364         PASS_OBJECT_ID = (1 << 4),
365         PASS_MATERIAL_ID = (1 << 5),
366         PASS_DIFFUSE_COLOR = (1 << 6),
367         PASS_GLOSSY_COLOR = (1 << 7),
368         PASS_TRANSMISSION_COLOR = (1 << 8),
369         PASS_DIFFUSE_INDIRECT = (1 << 9),
370         PASS_GLOSSY_INDIRECT = (1 << 10),
371         PASS_TRANSMISSION_INDIRECT = (1 << 11),
372         PASS_DIFFUSE_DIRECT = (1 << 12),
373         PASS_GLOSSY_DIRECT = (1 << 13),
374         PASS_TRANSMISSION_DIRECT = (1 << 14),
375         PASS_EMISSION = (1 << 15),
376         PASS_BACKGROUND = (1 << 16),
377         PASS_AO = (1 << 17),
378         PASS_SHADOW = (1 << 18),
379         PASS_MOTION = (1 << 19),
380         PASS_MOTION_WEIGHT = (1 << 20),
381         PASS_MIST = (1 << 21),
382         PASS_SUBSURFACE_DIRECT = (1 << 22),
383         PASS_SUBSURFACE_INDIRECT = (1 << 23),
384         PASS_SUBSURFACE_COLOR = (1 << 24),
385         PASS_LIGHT = (1 << 25), /* no real pass, used to force use_light_pass */
386 #ifdef __KERNEL_DEBUG__
387         PASS_BVH_TRAVERSED_NODES = (1 << 26),
388         PASS_BVH_TRAVERSED_INSTANCES = (1 << 27),
389         PASS_BVH_INTERSECTIONS = (1 << 28),
390         PASS_RAY_BOUNCES = (1 << 29),
391 #endif
392 } PassType;
393
394 #define PASS_ALL (~0)
395
396 typedef enum DenoisingPassOffsets {
397         DENOISING_PASS_NORMAL             = 0,
398         DENOISING_PASS_NORMAL_VAR         = 3,
399         DENOISING_PASS_ALBEDO             = 6,
400         DENOISING_PASS_ALBEDO_VAR         = 9,
401         DENOISING_PASS_DEPTH              = 12,
402         DENOISING_PASS_DEPTH_VAR          = 13,
403         DENOISING_PASS_SHADOW_A           = 14,
404         DENOISING_PASS_SHADOW_B           = 17,
405         DENOISING_PASS_COLOR              = 20,
406         DENOISING_PASS_COLOR_VAR          = 23,
407
408         DENOISING_PASS_SIZE_BASE          = 26,
409         DENOISING_PASS_SIZE_CLEAN         = 3,
410 } DenoisingPassOffsets;
411
412 typedef enum BakePassFilter {
413         BAKE_FILTER_NONE = 0,
414         BAKE_FILTER_DIRECT = (1 << 0),
415         BAKE_FILTER_INDIRECT = (1 << 1),
416         BAKE_FILTER_COLOR = (1 << 2),
417         BAKE_FILTER_DIFFUSE = (1 << 3),
418         BAKE_FILTER_GLOSSY = (1 << 4),
419         BAKE_FILTER_TRANSMISSION = (1 << 5),
420         BAKE_FILTER_SUBSURFACE = (1 << 6),
421         BAKE_FILTER_EMISSION = (1 << 7),
422         BAKE_FILTER_AO = (1 << 8),
423 } BakePassFilter;
424
425 typedef enum BakePassFilterCombos {
426         BAKE_FILTER_COMBINED = (
427             BAKE_FILTER_DIRECT |
428             BAKE_FILTER_INDIRECT |
429             BAKE_FILTER_DIFFUSE |
430             BAKE_FILTER_GLOSSY |
431             BAKE_FILTER_TRANSMISSION |
432             BAKE_FILTER_SUBSURFACE |
433             BAKE_FILTER_EMISSION |
434             BAKE_FILTER_AO),
435         BAKE_FILTER_DIFFUSE_DIRECT = (BAKE_FILTER_DIRECT | BAKE_FILTER_DIFFUSE),
436         BAKE_FILTER_GLOSSY_DIRECT = (BAKE_FILTER_DIRECT | BAKE_FILTER_GLOSSY),
437         BAKE_FILTER_TRANSMISSION_DIRECT = (BAKE_FILTER_DIRECT | BAKE_FILTER_TRANSMISSION),
438         BAKE_FILTER_SUBSURFACE_DIRECT = (BAKE_FILTER_DIRECT | BAKE_FILTER_SUBSURFACE),
439         BAKE_FILTER_DIFFUSE_INDIRECT = (BAKE_FILTER_INDIRECT | BAKE_FILTER_DIFFUSE),
440         BAKE_FILTER_GLOSSY_INDIRECT = (BAKE_FILTER_INDIRECT | BAKE_FILTER_GLOSSY),
441         BAKE_FILTER_TRANSMISSION_INDIRECT = (BAKE_FILTER_INDIRECT | BAKE_FILTER_TRANSMISSION),
442         BAKE_FILTER_SUBSURFACE_INDIRECT = (BAKE_FILTER_INDIRECT | BAKE_FILTER_SUBSURFACE),
443 } BakePassFilterCombos;
444
445 typedef enum DenoiseFlag {
446         DENOISING_CLEAN_DIFFUSE_DIR      = (1 << 0),
447         DENOISING_CLEAN_DIFFUSE_IND      = (1 << 1),
448         DENOISING_CLEAN_GLOSSY_DIR       = (1 << 2),
449         DENOISING_CLEAN_GLOSSY_IND       = (1 << 3),
450         DENOISING_CLEAN_TRANSMISSION_DIR = (1 << 4),
451         DENOISING_CLEAN_TRANSMISSION_IND = (1 << 5),
452         DENOISING_CLEAN_SUBSURFACE_DIR   = (1 << 6),
453         DENOISING_CLEAN_SUBSURFACE_IND   = (1 << 7),
454         DENOISING_CLEAN_ALL_PASSES       = (1 << 8)-1,
455 } DenoiseFlag;
456
457 #ifdef __KERNEL_DEBUG__
458 /* NOTE: This is a runtime-only struct, alignment is not
459  * really important here.
460  */
461 typedef struct DebugData {
462         int num_bvh_traversed_nodes;
463         int num_bvh_traversed_instances;
464         int num_bvh_intersections;
465         int num_ray_bounces;
466 } DebugData;
467 #endif
468
469 typedef ccl_addr_space struct PathRadianceState {
470 #ifdef __PASSES__
471         float3 diffuse;
472         float3 glossy;
473         float3 transmission;
474         float3 subsurface;
475         float3 scatter;
476
477         float3 direct;
478 #endif
479 } PathRadianceState;
480
481 typedef ccl_addr_space struct PathRadiance {
482 #ifdef __PASSES__
483         int use_light_pass;
484 #endif
485
486         float transparent;
487         float3 emission;
488 #ifdef __PASSES__
489         float3 background;
490         float3 ao;
491
492         float3 indirect;
493         float3 direct_emission;
494
495         float3 color_diffuse;
496         float3 color_glossy;
497         float3 color_transmission;
498         float3 color_subsurface;
499         float3 color_scatter;
500
501         float3 direct_diffuse;
502         float3 direct_glossy;
503         float3 direct_transmission;
504         float3 direct_subsurface;
505         float3 direct_scatter;
506
507         float3 indirect_diffuse;
508         float3 indirect_glossy;
509         float3 indirect_transmission;
510         float3 indirect_subsurface;
511         float3 indirect_scatter;
512
513         float4 shadow;
514         float mist;
515 #endif
516
517         struct PathRadianceState state;
518
519 #ifdef __SHADOW_TRICKS__
520         /* Total light reachable across the path, ignoring shadow blocked queries. */
521         float3 path_total;
522         /* Total light reachable across the path with shadow blocked queries
523          * applied here.
524          *
525          * Dividing this figure by path_total will give estimate of shadow pass.
526          */
527         float3 path_total_shaded;
528
529         /* Color of the background on which shadow is alpha-overed. */
530         float3 shadow_background_color;
531
532         /* Path radiance sum and throughput at the moment when ray hits shadow
533          * catcher object.
534          */
535         float shadow_throughput;
536
537         /* Accumulated transparency along the path after shadow catcher bounce. */
538         float shadow_transparency;
539
540         /* Indicate if any shadow catcher data is set. */
541         int has_shadow_catcher;
542 #endif
543
544 #ifdef __DENOISING_FEATURES__
545         float3 denoising_normal;
546         float3 denoising_albedo;
547         float denoising_depth;
548 #endif  /* __DENOISING_FEATURES__ */
549
550 #ifdef __KERNEL_DEBUG__
551         DebugData debug_data;
552 #endif /* __KERNEL_DEBUG__ */
553 } PathRadiance;
554
555 typedef struct BsdfEval {
556 #ifdef __PASSES__
557         int use_light_pass;
558 #endif
559
560         float3 diffuse;
561 #ifdef __PASSES__
562         float3 glossy;
563         float3 transmission;
564         float3 transparent;
565         float3 subsurface;
566         float3 scatter;
567 #endif
568 #ifdef __SHADOW_TRICKS__
569         float3 sum_no_mis;
570 #endif
571 } BsdfEval;
572
573 /* Shader Flag */
574
575 typedef enum ShaderFlag {
576         SHADER_SMOOTH_NORMAL = (1 << 31),
577         SHADER_CAST_SHADOW = (1 << 30),
578         SHADER_AREA_LIGHT = (1 << 29),
579         SHADER_USE_MIS = (1 << 28),
580         SHADER_EXCLUDE_DIFFUSE = (1 << 27),
581         SHADER_EXCLUDE_GLOSSY = (1 << 26),
582         SHADER_EXCLUDE_TRANSMIT = (1 << 25),
583         SHADER_EXCLUDE_CAMERA = (1 << 24),
584         SHADER_EXCLUDE_SCATTER = (1 << 23),
585         SHADER_EXCLUDE_ANY = (SHADER_EXCLUDE_DIFFUSE|SHADER_EXCLUDE_GLOSSY|SHADER_EXCLUDE_TRANSMIT|SHADER_EXCLUDE_CAMERA|SHADER_EXCLUDE_SCATTER),
586
587         SHADER_MASK = ~(SHADER_SMOOTH_NORMAL|SHADER_CAST_SHADOW|SHADER_AREA_LIGHT|SHADER_USE_MIS|SHADER_EXCLUDE_ANY)
588 } ShaderFlag;
589
590 /* Light Type */
591
592 typedef enum LightType {
593         LIGHT_POINT,
594         LIGHT_DISTANT,
595         LIGHT_BACKGROUND,
596         LIGHT_AREA,
597         LIGHT_SPOT,
598         LIGHT_TRIANGLE
599 } LightType;
600
601 /* Camera Type */
602
603 enum CameraType {
604         CAMERA_PERSPECTIVE,
605         CAMERA_ORTHOGRAPHIC,
606         CAMERA_PANORAMA
607 };
608
609 /* Panorama Type */
610
611 enum PanoramaType {
612         PANORAMA_EQUIRECTANGULAR = 0,
613         PANORAMA_FISHEYE_EQUIDISTANT = 1,
614         PANORAMA_FISHEYE_EQUISOLID = 2,
615         PANORAMA_MIRRORBALL = 3,
616
617         PANORAMA_NUM_TYPES,
618 };
619
620 /* Differential */
621
622 typedef struct differential3 {
623         float3 dx;
624         float3 dy;
625 } differential3;
626
627 typedef struct differential {
628         float dx;
629         float dy;
630 } differential;
631
632 /* Ray */
633
634 typedef struct Ray {
635 /* TODO(sergey): This is only needed because current AMD
636  * compiler has hard time building the kernel with this
637  * reshuffle. And at the same time reshuffle will cause
638  * less optimal CPU code in certain places.
639  *
640  * We'll get rid of this nasty exception once AMD compiler
641  * is fixed.
642  */
643 #ifndef __KERNEL_OPENCL_AMD__
644         float3 P;               /* origin */
645         float3 D;               /* direction */
646
647         float t;                /* length of the ray */
648         float time;             /* time (for motion blur) */
649 #else
650         float t;                /* length of the ray */
651         float time;             /* time (for motion blur) */
652         float3 P;               /* origin */
653         float3 D;               /* direction */
654 #endif
655
656 #ifdef __RAY_DIFFERENTIALS__
657         differential3 dP;
658         differential3 dD;
659 #endif
660 } Ray;
661
662 /* Intersection */
663
664 typedef struct Intersection {
665         float t, u, v;
666         int prim;
667         int object;
668         int type;
669
670 #ifdef __KERNEL_DEBUG__
671         int num_traversed_nodes;
672         int num_traversed_instances;
673         int num_intersections;
674 #endif
675 } Intersection;
676
677 /* Primitives */
678
679 typedef enum PrimitiveType {
680         PRIMITIVE_NONE            = 0,
681         PRIMITIVE_TRIANGLE        = (1 << 0),
682         PRIMITIVE_MOTION_TRIANGLE = (1 << 1),
683         PRIMITIVE_CURVE           = (1 << 2),
684         PRIMITIVE_MOTION_CURVE    = (1 << 3),
685         /* Lamp primitive is not included below on purpose,
686          * since it is no real traceable primitive.
687          */
688         PRIMITIVE_LAMP            = (1 << 4),
689
690         PRIMITIVE_ALL_TRIANGLE = (PRIMITIVE_TRIANGLE|PRIMITIVE_MOTION_TRIANGLE),
691         PRIMITIVE_ALL_CURVE = (PRIMITIVE_CURVE|PRIMITIVE_MOTION_CURVE),
692         PRIMITIVE_ALL_MOTION = (PRIMITIVE_MOTION_TRIANGLE|PRIMITIVE_MOTION_CURVE),
693         PRIMITIVE_ALL = (PRIMITIVE_ALL_TRIANGLE|PRIMITIVE_ALL_CURVE),
694
695         /* Total number of different traceable primitives.
696          * NOTE: This is an actual value, not a bitflag.
697          */
698         PRIMITIVE_NUM_TOTAL = 4,
699 } PrimitiveType;
700
701 #define PRIMITIVE_PACK_SEGMENT(type, segment) ((segment << PRIMITIVE_NUM_TOTAL) | (type))
702 #define PRIMITIVE_UNPACK_SEGMENT(type) (type >> PRIMITIVE_NUM_TOTAL)
703
704 /* Attributes */
705
706 typedef enum AttributePrimitive {
707         ATTR_PRIM_TRIANGLE = 0,
708         ATTR_PRIM_CURVE,
709         ATTR_PRIM_SUBD,
710
711         ATTR_PRIM_TYPES
712 } AttributePrimitive;
713
714 typedef enum AttributeElement {
715         ATTR_ELEMENT_NONE,
716         ATTR_ELEMENT_OBJECT,
717         ATTR_ELEMENT_MESH,
718         ATTR_ELEMENT_FACE,
719         ATTR_ELEMENT_VERTEX,
720         ATTR_ELEMENT_VERTEX_MOTION,
721         ATTR_ELEMENT_CORNER,
722         ATTR_ELEMENT_CORNER_BYTE,
723         ATTR_ELEMENT_CURVE,
724         ATTR_ELEMENT_CURVE_KEY,
725         ATTR_ELEMENT_CURVE_KEY_MOTION,
726         ATTR_ELEMENT_VOXEL
727 } AttributeElement;
728
729 typedef enum AttributeStandard {
730         ATTR_STD_NONE = 0,
731         ATTR_STD_VERTEX_NORMAL,
732         ATTR_STD_FACE_NORMAL,
733         ATTR_STD_UV,
734         ATTR_STD_UV_TANGENT,
735         ATTR_STD_UV_TANGENT_SIGN,
736         ATTR_STD_GENERATED,
737         ATTR_STD_GENERATED_TRANSFORM,
738         ATTR_STD_POSITION_UNDEFORMED,
739         ATTR_STD_POSITION_UNDISPLACED,
740         ATTR_STD_MOTION_VERTEX_POSITION,
741         ATTR_STD_MOTION_VERTEX_NORMAL,
742         ATTR_STD_PARTICLE,
743         ATTR_STD_CURVE_INTERCEPT,
744         ATTR_STD_PTEX_FACE_ID,
745         ATTR_STD_PTEX_UV,
746         ATTR_STD_VOLUME_DENSITY,
747         ATTR_STD_VOLUME_COLOR,
748         ATTR_STD_VOLUME_FLAME,
749         ATTR_STD_VOLUME_HEAT,
750         ATTR_STD_VOLUME_VELOCITY,
751         ATTR_STD_POINTINESS,
752         ATTR_STD_NUM,
753
754         ATTR_STD_NOT_FOUND = ~0
755 } AttributeStandard;
756
757 typedef enum AttributeFlag {
758         ATTR_FINAL_SIZE = (1 << 0),
759         ATTR_SUBDIVIDED = (1 << 1),
760 } AttributeFlag;
761
762 typedef struct AttributeDescriptor {
763         AttributeElement element;
764         NodeAttributeType type;
765         uint flags; /* see enum AttributeFlag */
766         int offset;
767 } AttributeDescriptor;
768
769 /* Closure data */
770
771 #ifdef __MULTI_CLOSURE__
772 #  ifndef __MAX_CLOSURE__
773 #     define MAX_CLOSURE 64
774 #  else
775 #    define MAX_CLOSURE __MAX_CLOSURE__
776 #  endif
777 #else
778 #  define MAX_CLOSURE 1
779 #endif
780
781 /* This struct is the base class for all closures. The common members are
782  * duplicated in all derived classes since we don't have C++ in the kernel
783  * yet, and because it lets us lay out the members to minimize padding. The
784  * weight member is located at the beginning of the struct for this reason.
785  *
786  * ShaderClosure has a fixed size, and any extra space must be allocated
787  * with closure_alloc_extra().
788  *
789  * We pad the struct to 80 bytes and ensure it is aligned to 16 bytes, which
790  * we assume to be the maximum required alignment for any struct. */
791
792 #define SHADER_CLOSURE_BASE \
793         float3 weight; \
794         ClosureType type; \
795         float sample_weight; \
796         float3 N
797
798 typedef ccl_addr_space struct ccl_align(16) ShaderClosure {
799         SHADER_CLOSURE_BASE;
800
801         float data[10]; /* pad to 80 bytes */
802 } ShaderClosure;
803
804 /* Shader Data
805  *
806  * Main shader state at a point on the surface or in a volume. All coordinates
807  * are in world space.
808  */
809
810 enum ShaderDataFlag {
811         /* Runtime flags. */
812
813         /* Set when ray hits backside of surface. */
814         SD_BACKFACING      = (1 << 0),
815         /* Shader has emissive closure. */
816         SD_EMISSION        = (1 << 1),
817         /* Shader has BSDF closure. */
818         SD_BSDF            = (1 << 2),
819         /* Shader has non-singular BSDF closure. */
820         SD_BSDF_HAS_EVAL   = (1 << 3),
821         /* Shader has BSSRDF closure. */
822         SD_BSSRDF          = (1 << 4),
823         /* Shader has holdout closure. */
824         SD_HOLDOUT         = (1 << 5),
825         /* Shader has volume absorption closure. */
826         SD_ABSORPTION      = (1 << 6),
827         /* Shader has have volume phase (scatter) closure. */
828         SD_SCATTER         = (1 << 7),
829         /* Shader has AO closure. */
830         SD_AO              = (1 << 8),
831         /* Shader has transparent closure. */
832         SD_TRANSPARENT     = (1 << 9),
833         /* BSDF requires LCG for evaluation. */
834         SD_BSDF_NEEDS_LCG  = (1 << 10),
835
836         SD_CLOSURE_FLAGS = (SD_EMISSION |
837                             SD_BSDF |
838                             SD_BSDF_HAS_EVAL |
839                             SD_BSSRDF |
840                             SD_HOLDOUT |
841                             SD_ABSORPTION |
842                             SD_SCATTER |
843                             SD_AO |
844                             SD_BSDF_NEEDS_LCG),
845
846         /* Shader flags. */
847
848         /* direct light sample */
849         SD_USE_MIS                = (1 << 16),
850         /* Has transparent shadow. */
851         SD_HAS_TRANSPARENT_SHADOW = (1 << 17),
852         /* Has volume shader. */
853         SD_HAS_VOLUME             = (1 << 18),
854         /* Has only volume shader, no surface. */
855         SD_HAS_ONLY_VOLUME        = (1 << 19),
856         /* Has heterogeneous volume. */
857         SD_HETEROGENEOUS_VOLUME   = (1 << 20),
858         /* BSSRDF normal uses bump. */
859         SD_HAS_BSSRDF_BUMP        = (1 << 21),
860         /* Use equiangular volume sampling */
861         SD_VOLUME_EQUIANGULAR     = (1 << 22),
862         /* Use multiple importance volume sampling. */
863         SD_VOLUME_MIS             = (1 << 23),
864         /* Use cubic interpolation for voxels. */
865         SD_VOLUME_CUBIC           = (1 << 24),
866         /* Has data connected to the displacement input or uses bump map. */
867         SD_HAS_BUMP               = (1 << 25),
868         /* Has true displacement. */
869         SD_HAS_DISPLACEMENT       = (1 << 26),
870         /* Has constant emission (value stored in __shader_flag) */
871         SD_HAS_CONSTANT_EMISSION  = (1 << 27),
872
873         SD_SHADER_FLAGS = (SD_USE_MIS |
874                            SD_HAS_TRANSPARENT_SHADOW |
875                            SD_HAS_VOLUME |
876                            SD_HAS_ONLY_VOLUME |
877                            SD_HETEROGENEOUS_VOLUME|
878                            SD_HAS_BSSRDF_BUMP |
879                            SD_VOLUME_EQUIANGULAR |
880                            SD_VOLUME_MIS |
881                            SD_VOLUME_CUBIC |
882                            SD_HAS_BUMP |
883                            SD_HAS_DISPLACEMENT |
884                            SD_HAS_CONSTANT_EMISSION)
885 };
886
887         /* Object flags. */
888 enum ShaderDataObjectFlag {
889         /* Holdout for camera rays. */
890         SD_OBJECT_HOLDOUT_MASK           = (1 << 0),
891         /* Has object motion blur. */
892         SD_OBJECT_MOTION                 = (1 << 1),
893         /* Vertices have transform applied. */
894         SD_OBJECT_TRANSFORM_APPLIED      = (1 << 2),
895         /* Vertices have negative scale applied. */
896         SD_OBJECT_NEGATIVE_SCALE_APPLIED = (1 << 3),
897         /* Object has a volume shader. */
898         SD_OBJECT_HAS_VOLUME             = (1 << 4),
899         /* Object intersects AABB of an object with volume shader. */
900         SD_OBJECT_INTERSECTS_VOLUME      = (1 << 5),
901         /* Has position for motion vertices. */
902         SD_OBJECT_HAS_VERTEX_MOTION      = (1 << 6),
903         /* object is used to catch shadows */
904         SD_OBJECT_SHADOW_CATCHER         = (1 << 7),
905
906         SD_OBJECT_FLAGS = (SD_OBJECT_HOLDOUT_MASK |
907                            SD_OBJECT_MOTION |
908                            SD_OBJECT_TRANSFORM_APPLIED |
909                            SD_OBJECT_NEGATIVE_SCALE_APPLIED |
910                            SD_OBJECT_HAS_VOLUME |
911                            SD_OBJECT_INTERSECTS_VOLUME |
912                            SD_OBJECT_SHADOW_CATCHER)
913 };
914
915 typedef ccl_addr_space struct ShaderData {
916         /* position */
917         float3 P;
918         /* smooth normal for shading */
919         float3 N;
920         /* true geometric normal */
921         float3 Ng;
922         /* view/incoming direction */
923         float3 I;
924         /* shader id */
925         int shader;
926         /* booleans describing shader, see ShaderDataFlag */
927         int flag;
928         /* booleans describing object of the shader, see ShaderDataObjectFlag */
929         int object_flag;
930
931         /* primitive id if there is one, ~0 otherwise */
932         int prim;
933
934         /* combined type and curve segment for hair */
935         int type;
936
937         /* parametric coordinates
938          * - barycentric weights for triangles */
939         float u;
940         float v;
941         /* object id if there is one, ~0 otherwise */
942         int object;
943
944         /* motion blur sample time */
945         float time;
946
947         /* length of the ray being shaded */
948         float ray_length;
949
950 #ifdef __RAY_DIFFERENTIALS__
951         /* differential of P. these are orthogonal to Ng, not N */
952         differential3 dP;
953         /* differential of I */
954         differential3 dI;
955         /* differential of u, v */
956         differential du;
957         differential dv;
958 #endif
959 #ifdef __DPDU__
960         /* differential of P w.r.t. parametric coordinates. note that dPdu is
961          * not readily suitable as a tangent for shading on triangles. */
962         float3 dPdu;
963         float3 dPdv;
964 #endif
965
966 #ifdef __OBJECT_MOTION__
967         /* object <-> world space transformations, cached to avoid
968          * re-interpolating them constantly for shading */
969         Transform ob_tfm;
970         Transform ob_itfm;
971 #endif
972
973         /* Closure data, we store a fixed array of closures */
974         struct ShaderClosure closure[MAX_CLOSURE];
975         int num_closure;
976         int num_closure_extra;
977         float randb_closure;
978         float3 svm_closure_weight;
979
980         /* LCG state for closures that require additional random numbers. */
981         uint lcg_state;
982
983         /* ray start position, only set for backgrounds */
984         float3 ray_P;
985         differential3 ray_dP;
986
987 #ifdef __OSL__
988         struct KernelGlobals *osl_globals;
989         struct PathState *osl_path_state;
990 #endif
991 } ShaderData;
992
993 /* Path State */
994
995 #ifdef __VOLUME__
996 typedef struct VolumeStack {
997         int object;
998         int shader;
999 } VolumeStack;
1000 #endif
1001
1002 typedef struct PathState {
1003         /* see enum PathRayFlag */
1004         int flag;
1005
1006         /* random number generator state */
1007         uint rng_hash;          /* per pixel hash */
1008         int rng_offset;         /* dimension offset */
1009         int sample;             /* path sample number */
1010         int num_samples;        /* total number of times this path will be sampled */
1011         float branch_factor;    /* number of branches in indirect paths */
1012
1013         /* bounce counting */
1014         int bounce;
1015         int diffuse_bounce;
1016         int glossy_bounce;
1017         int transmission_bounce;
1018         int transparent_bounce;
1019
1020 #ifdef __DENOISING_FEATURES__
1021         float denoising_feature_weight;
1022 #endif  /* __DENOISING_FEATURES__ */
1023
1024         /* multiple importance sampling */
1025         float min_ray_pdf; /* smallest bounce pdf over entire path up to now */
1026         float ray_pdf;     /* last bounce pdf */
1027 #ifdef __LAMP_MIS__
1028         float ray_t;       /* accumulated distance through transparent surfaces */
1029 #endif
1030
1031         /* volume rendering */
1032 #ifdef __VOLUME__
1033         int volume_bounce;
1034         uint rng_congruential;
1035         VolumeStack volume_stack[VOLUME_STACK_SIZE];
1036 #endif
1037 } PathState;
1038
1039 /* Subsurface */
1040
1041 /* Struct to gather multiple SSS hits. */
1042 typedef struct SubsurfaceIntersection {
1043         Ray ray;
1044         float3 weight[BSSRDF_MAX_HITS];
1045
1046         int num_hits;
1047         struct Intersection hits[BSSRDF_MAX_HITS];
1048         float3 Ng[BSSRDF_MAX_HITS];
1049 } SubsurfaceIntersection;
1050
1051 /* Struct to gather SSS indirect rays and delay tracing them. */
1052 typedef struct SubsurfaceIndirectRays {
1053         PathState state[BSSRDF_MAX_HITS];
1054
1055         int num_rays;
1056
1057         struct Ray rays[BSSRDF_MAX_HITS];
1058         float3 throughputs[BSSRDF_MAX_HITS];
1059         struct PathRadianceState L_state[BSSRDF_MAX_HITS];
1060 } SubsurfaceIndirectRays;
1061
1062 /* Constant Kernel Data
1063  *
1064  * These structs are passed from CPU to various devices, and the struct layout
1065  * must match exactly. Structs are padded to ensure 16 byte alignment, and we
1066  * do not use float3 because its size may not be the same on all devices. */
1067
1068 typedef struct KernelCamera {
1069         /* type */
1070         int type;
1071
1072         /* panorama */
1073         int panorama_type;
1074         float fisheye_fov;
1075         float fisheye_lens;
1076         float4 equirectangular_range;
1077
1078         /* stereo */
1079         float interocular_offset;
1080         float convergence_distance;
1081         float pole_merge_angle_from;
1082         float pole_merge_angle_to;
1083
1084         /* matrices */
1085         Transform cameratoworld;
1086         Transform rastertocamera;
1087
1088         /* differentials */
1089         float4 dx;
1090         float4 dy;
1091
1092         /* depth of field */
1093         float aperturesize;
1094         float blades;
1095         float bladesrotation;
1096         float focaldistance;
1097
1098         /* motion blur */
1099         float shuttertime;
1100         int have_motion, have_perspective_motion;
1101
1102         /* clipping */
1103         float nearclip;
1104         float cliplength;
1105
1106         /* sensor size */
1107         float sensorwidth;
1108         float sensorheight;
1109
1110         /* render size */
1111         float width, height;
1112         int resolution;
1113
1114         /* anamorphic lens bokeh */
1115         float inv_aperture_ratio;
1116
1117         int is_inside_volume;
1118
1119         /* more matrices */
1120         Transform screentoworld;
1121         Transform rastertoworld;
1122         /* work around cuda sm 2.0 crash, this seems to
1123          * cross some limit in combination with motion 
1124          * Transform ndctoworld; */
1125         Transform worldtoscreen;
1126         Transform worldtoraster;
1127         Transform worldtondc;
1128         Transform worldtocamera;
1129
1130         MotionTransform motion;
1131
1132         /* Denotes changes in the projective matrix, namely in rastertocamera.
1133          * Used for camera zoom motion blur,
1134          */
1135         PerspectiveMotionTransform perspective_motion;
1136
1137         int shutter_table_offset;
1138
1139         /* Rolling shutter */
1140         int rolling_shutter_type;
1141         float rolling_shutter_duration;
1142
1143         int pad;
1144 } KernelCamera;
1145 static_assert_align(KernelCamera, 16);
1146
1147 typedef struct KernelFilm {
1148         float exposure;
1149         int pass_flag;
1150         int pass_stride;
1151         int use_light_pass;
1152
1153         int pass_combined;
1154         int pass_depth;
1155         int pass_normal;
1156         int pass_motion;
1157
1158         int pass_motion_weight;
1159         int pass_uv;
1160         int pass_object_id;
1161         int pass_material_id;
1162
1163         int pass_diffuse_color;
1164         int pass_glossy_color;
1165         int pass_transmission_color;
1166         int pass_subsurface_color;
1167         
1168         int pass_diffuse_indirect;
1169         int pass_glossy_indirect;
1170         int pass_transmission_indirect;
1171         int pass_subsurface_indirect;
1172         
1173         int pass_diffuse_direct;
1174         int pass_glossy_direct;
1175         int pass_transmission_direct;
1176         int pass_subsurface_direct;
1177         
1178         int pass_emission;
1179         int pass_background;
1180         int pass_ao;
1181         float pass_alpha_threshold;
1182
1183         int pass_shadow;
1184         float pass_shadow_scale;
1185         int filter_table_offset;
1186         int pass_pad2;
1187
1188         int pass_mist;
1189         float mist_start;
1190         float mist_inv_depth;
1191         float mist_falloff;
1192
1193         int pass_denoising_data;
1194         int pass_denoising_clean;
1195         int denoising_flags;
1196         int pad;
1197
1198 #ifdef __KERNEL_DEBUG__
1199         int pass_bvh_traversed_nodes;
1200         int pass_bvh_traversed_instances;
1201         int pass_bvh_intersections;
1202         int pass_ray_bounces;
1203 #endif
1204 } KernelFilm;
1205 static_assert_align(KernelFilm, 16);
1206
1207 typedef struct KernelBackground {
1208         /* only shader index */
1209         int surface_shader;
1210         int volume_shader;
1211         int transparent;
1212         int pad;
1213
1214         /* ambient occlusion */
1215         float ao_factor;
1216         float ao_distance;
1217         float ao_pad1, ao_pad2;
1218 } KernelBackground;
1219 static_assert_align(KernelBackground, 16);
1220
1221 typedef struct KernelIntegrator {
1222         /* emission */
1223         int use_direct_light;
1224         int use_ambient_occlusion;
1225         int num_distribution;
1226         int num_all_lights;
1227         float pdf_triangles;
1228         float pdf_lights;
1229         float inv_pdf_lights;
1230         int pdf_background_res;
1231
1232         /* light portals */
1233         float portal_pdf;
1234         int num_portals;
1235         int portal_offset;
1236
1237         /* bounces */
1238         int max_bounce;
1239
1240         int max_diffuse_bounce;
1241         int max_glossy_bounce;
1242         int max_transmission_bounce;
1243         int max_volume_bounce;
1244
1245         int ao_bounces;
1246
1247         /* transparent */
1248         int transparent_max_bounce;
1249         int transparent_shadows;
1250
1251         /* caustics */
1252         int caustics_reflective;
1253         int caustics_refractive;
1254         float filter_glossy;
1255
1256         /* seed */
1257         int seed;
1258
1259         /* clamp */
1260         float sample_clamp_direct;
1261         float sample_clamp_indirect;
1262
1263         /* branched path */
1264         int branched;
1265         int diffuse_samples;
1266         int glossy_samples;
1267         int transmission_samples;
1268         int ao_samples;
1269         int mesh_light_samples;
1270         int subsurface_samples;
1271         int sample_all_lights_direct;
1272         int sample_all_lights_indirect;
1273
1274         /* mis */
1275         int use_lamp_mis;
1276
1277         /* sampler */
1278         int sampling_pattern;
1279         int aa_samples;
1280
1281         /* volume render */
1282         int use_volumes;
1283         int volume_max_steps;
1284         float volume_step_size;
1285         int volume_samples;
1286
1287         float light_inv_rr_threshold;
1288
1289         int start_sample;
1290         int pad1;
1291 } KernelIntegrator;
1292 static_assert_align(KernelIntegrator, 16);
1293
1294 typedef struct KernelBVH {
1295         /* root node */
1296         int root;
1297         int attributes_map_stride;
1298         int have_motion;
1299         int have_curves;
1300         int have_instancing;
1301         int use_qbvh;
1302         int use_bvh_steps;
1303         int pad1;
1304 } KernelBVH;
1305 static_assert_align(KernelBVH, 16);
1306
1307 typedef enum CurveFlag {
1308         /* runtime flags */
1309         CURVE_KN_BACKFACING = 1,                                /* backside of cylinder? */
1310         CURVE_KN_ENCLOSEFILTER = 2,                             /* don't consider strands surrounding start point? */
1311         CURVE_KN_INTERPOLATE = 4,                               /* render as a curve? */
1312         CURVE_KN_ACCURATE = 8,                                  /* use accurate intersections test? */
1313         CURVE_KN_INTERSECTCORRECTION = 16,              /* correct for width after determing closest midpoint? */
1314         CURVE_KN_TRUETANGENTGNORMAL = 32,               /* use tangent normal for geometry? */
1315         CURVE_KN_RIBBONS = 64,                                  /* use flat curve ribbons */
1316 } CurveFlag;
1317
1318 typedef struct KernelCurves {
1319         int curveflags;
1320         int subdivisions;
1321
1322         float minimum_width;
1323         float maximum_width;
1324 } KernelCurves;
1325 static_assert_align(KernelCurves, 16);
1326
1327 typedef struct KernelTables {
1328         int beckmann_offset;
1329         int pad1, pad2, pad3;
1330 } KernelTables;
1331 static_assert_align(KernelTables, 16);
1332
1333 typedef struct KernelData {
1334         KernelCamera cam;
1335         KernelFilm film;
1336         KernelBackground background;
1337         KernelIntegrator integrator;
1338         KernelBVH bvh;
1339         KernelCurves curve;
1340         KernelTables tables;
1341 } KernelData;
1342 static_assert_align(KernelData, 16);
1343
1344 /* Declarations required for split kernel */
1345
1346 /* Macro for queues */
1347 /* Value marking queue's empty slot */
1348 #define QUEUE_EMPTY_SLOT -1
1349
1350 /*
1351  * Queue 1 - Active rays
1352  * Queue 2 - Background queue
1353  * Queue 3 - Shadow ray cast kernel - AO
1354  * Queeu 4 - Shadow ray cast kernel - direct lighting
1355  */
1356
1357 /* Queue names */
1358 enum QueueNumber {
1359         /* All active rays and regenerated rays are enqueued here. */
1360         QUEUE_ACTIVE_AND_REGENERATED_RAYS = 0,
1361
1362         /* All
1363          * 1. Background-hit rays,
1364          * 2. Rays that has exited path-iteration but needs to update output buffer
1365          * 3. Rays to be regenerated
1366          * are enqueued here.
1367          */
1368         QUEUE_HITBG_BUFF_UPDATE_TOREGEN_RAYS,
1369
1370         /* All rays for which a shadow ray should be cast to determine radiance
1371          * contribution for AO are enqueued here.
1372          */
1373         QUEUE_SHADOW_RAY_CAST_AO_RAYS,
1374
1375         /* All rays for which a shadow ray should be cast to determine radiance
1376          * contributing for direct lighting are enqueued here.
1377          */
1378         QUEUE_SHADOW_RAY_CAST_DL_RAYS,
1379
1380         /* Rays sorted according to shader->id */
1381         QUEUE_SHADER_SORTED_RAYS,
1382
1383 #ifdef __BRANCHED_PATH__
1384         /* All rays moving to next iteration of the indirect loop for light */
1385         QUEUE_LIGHT_INDIRECT_ITER,
1386         /* Queue of all inactive rays. These are candidates for sharing work of indirect loops */
1387         QUEUE_INACTIVE_RAYS,
1388 #  ifdef __VOLUME__
1389         /* All rays moving to next iteration of the indirect loop for volumes */
1390         QUEUE_VOLUME_INDIRECT_ITER,
1391 #  endif
1392 #  ifdef __SUBSURFACE__
1393         /* All rays moving to next iteration of the indirect loop for subsurface */
1394         QUEUE_SUBSURFACE_INDIRECT_ITER,
1395 #  endif
1396 #endif  /* __BRANCHED_PATH__ */
1397
1398         NUM_QUEUES
1399 };
1400
1401 /* We use RAY_STATE_MASK to get ray_state */
1402 #define RAY_STATE_MASK 0x0F
1403 #define RAY_FLAG_MASK 0xF0
1404 enum RayState {
1405         RAY_INVALID = 0,
1406         /* Denotes ray is actively involved in path-iteration. */
1407         RAY_ACTIVE,
1408         /* Denotes ray has completed processing all samples and is inactive. */
1409         RAY_INACTIVE,
1410         /* Denoted ray has exited path-iteration and needs to update output buffer. */
1411         RAY_UPDATE_BUFFER,
1412         /* Donotes ray has hit background */
1413         RAY_HIT_BACKGROUND,
1414         /* Denotes ray has to be regenerated */
1415         RAY_TO_REGENERATE,
1416         /* Denotes ray has been regenerated */
1417         RAY_REGENERATED,
1418         /* Denotes ray is moving to next iteration of the branched indirect loop */
1419         RAY_LIGHT_INDIRECT_NEXT_ITER,
1420         RAY_VOLUME_INDIRECT_NEXT_ITER,
1421         RAY_SUBSURFACE_INDIRECT_NEXT_ITER,
1422
1423         /* Ray flags */
1424
1425         /* Flags to denote that the ray is currently evaluating the branched indirect loop */
1426         RAY_BRANCHED_LIGHT_INDIRECT = (1 << 4),
1427         RAY_BRANCHED_VOLUME_INDIRECT = (1 << 5),
1428         RAY_BRANCHED_SUBSURFACE_INDIRECT = (1 << 6),
1429         RAY_BRANCHED_INDIRECT = (RAY_BRANCHED_LIGHT_INDIRECT | RAY_BRANCHED_VOLUME_INDIRECT | RAY_BRANCHED_SUBSURFACE_INDIRECT),
1430
1431         /* Ray is evaluating an iteration of an indirect loop for another thread */
1432         RAY_BRANCHED_INDIRECT_SHARED = (1 << 7),
1433 };
1434
1435 #define ASSIGN_RAY_STATE(ray_state, ray_index, state) (ray_state[ray_index] = ((ray_state[ray_index] & RAY_FLAG_MASK) | state))
1436 #define IS_STATE(ray_state, ray_index, state) ((ray_index) != QUEUE_EMPTY_SLOT && ((ray_state)[(ray_index)] & RAY_STATE_MASK) == (state))
1437 #define ADD_RAY_FLAG(ray_state, ray_index, flag) (ray_state[ray_index] = (ray_state[ray_index] | flag))
1438 #define REMOVE_RAY_FLAG(ray_state, ray_index, flag) (ray_state[ray_index] = (ray_state[ray_index] & (~flag)))
1439 #define IS_FLAG(ray_state, ray_index, flag) (ray_state[ray_index] & flag)
1440
1441 /* Patches */
1442
1443 #define PATCH_MAX_CONTROL_VERTS 16
1444
1445 /* Patch map node flags */
1446
1447 #define PATCH_MAP_NODE_IS_SET (1 << 30)
1448 #define PATCH_MAP_NODE_IS_LEAF (1u << 31)
1449 #define PATCH_MAP_NODE_INDEX_MASK (~(PATCH_MAP_NODE_IS_SET | PATCH_MAP_NODE_IS_LEAF))
1450
1451 CCL_NAMESPACE_END
1452
1453 #endif /*  __KERNEL_TYPES_H__ */
1454