Cycles: Delay shooting SSS indirect rays
[blender-staging.git] / intern / cycles / kernel / kernel_types.h
1 /*
2  * Copyright 2011-2013 Blender Foundation
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef __KERNEL_TYPES_H__
18 #define __KERNEL_TYPES_H__
19
20 #include "kernel_math.h"
21 #include "svm/svm_types.h"
22
23 #ifndef __KERNEL_GPU__
24 #define __KERNEL_CPU__
25 #endif
26
27 /* TODO(sergey): This is only to make it possible to include this header
28  * from outside of the kernel. but this could be done somewhat cleaner?
29  */
30 #ifndef ccl_addr_space
31 #define ccl_addr_space
32 #endif
33
34 CCL_NAMESPACE_BEGIN
35
36 /* constants */
37 #define OBJECT_SIZE             11
38 #define OBJECT_VECTOR_SIZE      6
39 #define LIGHT_SIZE                      5
40 #define FILTER_TABLE_SIZE       1024
41 #define RAMP_TABLE_SIZE         256
42 #define SHUTTER_TABLE_SIZE              256
43 #define PARTICLE_SIZE           5
44 #define TIME_INVALID            FLT_MAX
45
46 #define BSSRDF_MIN_RADIUS                       1e-8f
47 #define BSSRDF_MAX_HITS                         4
48
49 #define BECKMANN_TABLE_SIZE             256
50
51 #define TEX_NUM_FLOAT_IMAGES    5
52
53 #define SHADER_NONE                             (~0)
54 #define OBJECT_NONE                             (~0)
55 #define PRIM_NONE                               (~0)
56 #define LAMP_NONE                               (~0)
57
58 #define VOLUME_STACK_SIZE               16
59
60 /* device capabilities */
61 #ifdef __KERNEL_CPU__
62 #ifdef __KERNEL_SSE2__
63 #  define __QBVH__
64 #endif
65 #define __KERNEL_SHADING__
66 #define __KERNEL_ADV_SHADING__
67 #define __BRANCHED_PATH__
68 #ifdef WITH_OSL
69 #define __OSL__
70 #endif
71 #define __SUBSURFACE__
72 #define __CMJ__
73 #define __VOLUME__
74 #define __VOLUME_DECOUPLED__
75 #define __VOLUME_SCATTER__
76 #define __SHADOW_RECORD_ALL__
77 #define __VOLUME_RECORD_ALL__
78 #endif
79
80 #ifdef __KERNEL_CUDA__
81 #define __KERNEL_SHADING__
82 #define __KERNEL_ADV_SHADING__
83 #define __BRANCHED_PATH__
84 #define __VOLUME__
85 #define __VOLUME_SCATTER__
86
87 /* Experimental on GPU */
88 #ifdef __KERNEL_EXPERIMENTAL__
89 #define __SUBSURFACE__
90 #define __CMJ__
91 #endif
92
93 #endif
94
95 #ifdef __KERNEL_OPENCL__
96
97 /* keep __KERNEL_ADV_SHADING__ in sync with opencl_kernel_use_advanced_shading! */
98
99 #ifdef __KERNEL_OPENCL_NVIDIA__
100 #  define __KERNEL_SHADING__
101 #  define __KERNEL_ADV_SHADING__
102 #  ifdef __KERNEL_EXPERIMENTAL__
103 #    define __CMJ__
104 #  endif
105 #endif
106
107 #ifdef __KERNEL_OPENCL_APPLE__
108 #  define __KERNEL_SHADING__
109 #  define __KERNEL_ADV_SHADING__
110 /* TODO(sergey): Currently experimental section is ignored here,
111  * this is because megakernel in device_opencl does not support
112  * custom cflags depending on the scene features.
113  */
114 #  ifdef __KERNEL_EXPERIMENTAL__
115 #    define __CMJ__
116 #  endif
117 #endif
118
119 #ifdef __KERNEL_OPENCL_AMD__
120 #  define __CL_USE_NATIVE__
121 #  define __KERNEL_SHADING__
122 #  define __MULTI_CLOSURE__
123 #  define __PASSES__
124 #  define __BACKGROUND_MIS__
125 #  define __LAMP_MIS__
126 #  define __AO__
127 #  define __CAMERA_MOTION__
128 #  define __OBJECT_MOTION__
129 #  define __HAIR__
130 #  ifdef __KERNEL_EXPERIMENTAL__
131 #    define __TRANSPARENT_SHADOWS__
132 #  endif
133 #endif
134
135 #ifdef __KERNEL_OPENCL_INTEL_CPU__
136 #  define __CL_USE_NATIVE__
137 #  define __KERNEL_SHADING__
138 #  define __KERNEL_ADV_SHADING__
139 #  ifdef __KERNEL_EXPERIMENTAL__
140 #    define __CMJ__
141 #  endif
142 #endif
143
144 #endif // __KERNEL_OPENCL__
145
146 /* kernel features */
147 #define __SOBOL__
148 #define __INSTANCING__
149 #define __DPDU__
150 #define __UV__
151 #define __BACKGROUND__
152 #define __CAUSTICS_TRICKS__
153 #define __VISIBILITY_FLAG__
154 #define __RAY_DIFFERENTIALS__
155 #define __CAMERA_CLIPPING__
156 #define __INTERSECTION_REFINE__
157 #define __CLAMP_SAMPLE__
158
159 #ifdef __KERNEL_SHADING__
160 #define __SVM__
161 #define __EMISSION__
162 #define __TEXTURES__
163 #define __EXTRA_NODES__
164 #define __HOLDOUT__
165 #endif
166
167 #ifdef __KERNEL_ADV_SHADING__
168 #define __MULTI_CLOSURE__
169 #define __TRANSPARENT_SHADOWS__
170 #define __PASSES__
171 #define __BACKGROUND_MIS__
172 #define __LAMP_MIS__
173 #define __AO__
174 #define __CAMERA_MOTION__
175 #define __OBJECT_MOTION__
176 #define __HAIR__
177 #endif
178
179 #ifdef WITH_CYCLES_DEBUG
180 #  define __KERNEL_DEBUG__
181 #endif
182
183 /* Scene-based selective featrues compilation. */
184 #ifdef __NO_CAMERA_MOTION__
185 #  undef __CAMERA_MOTION__
186 #endif
187 #ifdef __NO_OBJECT_MOTION__
188 #  undef __OBJECT_MOTION__
189 #endif
190 #ifdef __NO_HAIR__
191 #  undef __HAIR__
192 #endif
193 #ifdef __NO_SUBSURFACE__
194 #  undef __SUBSURFACE__
195 #endif
196 #ifdef __NO_BRANCHED_PATH__
197 #  undef __BRANCHED_PATH__
198 #endif
199
200 /* Random Numbers */
201
202 typedef uint RNG;
203
204 /* Shader Evaluation */
205
206 typedef enum ShaderEvalType {
207         SHADER_EVAL_DISPLACE,
208         SHADER_EVAL_BACKGROUND,
209         /* bake types */
210         SHADER_EVAL_BAKE, /* no real shade, it's used in the code to
211                            * differentiate the type of shader eval from the above
212                            */
213         /* data passes */
214         SHADER_EVAL_NORMAL,
215         SHADER_EVAL_UV,
216         SHADER_EVAL_DIFFUSE_COLOR,
217         SHADER_EVAL_GLOSSY_COLOR,
218         SHADER_EVAL_TRANSMISSION_COLOR,
219         SHADER_EVAL_SUBSURFACE_COLOR,
220         SHADER_EVAL_EMISSION,
221
222         /* light passes */
223         SHADER_EVAL_AO,
224         SHADER_EVAL_COMBINED,
225         SHADER_EVAL_SHADOW,
226         SHADER_EVAL_DIFFUSE_DIRECT,
227         SHADER_EVAL_GLOSSY_DIRECT,
228         SHADER_EVAL_TRANSMISSION_DIRECT,
229         SHADER_EVAL_SUBSURFACE_DIRECT,
230         SHADER_EVAL_DIFFUSE_INDIRECT,
231         SHADER_EVAL_GLOSSY_INDIRECT,
232         SHADER_EVAL_TRANSMISSION_INDIRECT,
233         SHADER_EVAL_SUBSURFACE_INDIRECT,
234
235         /* extra */
236         SHADER_EVAL_ENVIRONMENT,
237 } ShaderEvalType;
238
239 /* Path Tracing
240  * note we need to keep the u/v pairs at even values */
241
242 enum PathTraceDimension {
243         PRNG_FILTER_U = 0,
244         PRNG_FILTER_V = 1,
245         PRNG_LENS_U = 2,
246         PRNG_LENS_V = 3,
247 #ifdef __CAMERA_MOTION__
248         PRNG_TIME = 4,
249         PRNG_UNUSED_0 = 5,
250         PRNG_UNUSED_1 = 6,      /* for some reason (6, 7) is a bad sobol pattern */
251         PRNG_UNUSED_2 = 7,  /* with a low number of samples (< 64) */
252 #endif
253         PRNG_BASE_NUM = 8,
254
255         PRNG_BSDF_U = 0,
256         PRNG_BSDF_V = 1,
257         PRNG_BSDF = 2,
258         PRNG_LIGHT = 3,
259         PRNG_LIGHT_U = 4,
260         PRNG_LIGHT_V = 5,
261         PRNG_UNUSED_3 = 6,
262         PRNG_TERMINATE = 7,
263
264 #ifdef __VOLUME__
265         PRNG_PHASE_U = 8,
266         PRNG_PHASE_V = 9,
267         PRNG_PHASE = 10,
268         PRNG_SCATTER_DISTANCE = 11,
269 #endif
270
271         PRNG_BOUNCE_NUM = 12,
272 };
273
274 enum SamplingPattern {
275         SAMPLING_PATTERN_SOBOL = 0,
276         SAMPLING_PATTERN_CMJ = 1
277 };
278
279 /* these flags values correspond to raytypes in osl.cpp, so keep them in sync!
280  *
281  * for ray visibility tests in BVH traversal, the upper 20 bits are used for
282  * layer visibility tests. */
283
284 enum PathRayFlag {
285         PATH_RAY_CAMERA = 1,
286         PATH_RAY_REFLECT = 2,
287         PATH_RAY_TRANSMIT = 4,
288         PATH_RAY_DIFFUSE = 8,
289         PATH_RAY_GLOSSY = 16,
290         PATH_RAY_SINGULAR = 32,
291         PATH_RAY_TRANSPARENT = 64,
292
293         PATH_RAY_SHADOW_OPAQUE = 128,
294         PATH_RAY_SHADOW_TRANSPARENT = 256,
295         PATH_RAY_SHADOW = (PATH_RAY_SHADOW_OPAQUE|PATH_RAY_SHADOW_TRANSPARENT),
296
297         PATH_RAY_CURVE = 512, /* visibility flag to define curve segments */
298         PATH_RAY_VOLUME_SCATTER = 1024, /* volume scattering */
299
300         /* note that these can use maximum 12 bits, the other are for layers */
301         PATH_RAY_ALL_VISIBILITY = (1|2|4|8|16|32|64|128|256|512|1024),
302
303         PATH_RAY_MIS_SKIP = 2048,
304         PATH_RAY_DIFFUSE_ANCESTOR = 4096,
305         PATH_RAY_SINGLE_PASS_DONE = 8192,
306
307         /* we need layer member flags to be the 20 upper bits */
308         PATH_RAY_LAYER_SHIFT = (32-20)
309 };
310
311 /* Closure Label */
312
313 typedef enum ClosureLabel {
314         LABEL_NONE = 0,
315         LABEL_TRANSMIT = 1,
316         LABEL_REFLECT = 2,
317         LABEL_DIFFUSE = 4,
318         LABEL_GLOSSY = 8,
319         LABEL_SINGULAR = 16,
320         LABEL_TRANSPARENT = 32,
321         LABEL_VOLUME_SCATTER = 64,
322 } ClosureLabel;
323
324 /* Render Passes */
325
326 typedef enum PassType {
327         PASS_NONE = 0,
328         PASS_COMBINED = (1 << 0),
329         PASS_DEPTH = (1 << 1),
330         PASS_NORMAL = (1 << 2),
331         PASS_UV = (1 << 3),
332         PASS_OBJECT_ID = (1 << 4),
333         PASS_MATERIAL_ID = (1 << 5),
334         PASS_DIFFUSE_COLOR = (1 << 6),
335         PASS_GLOSSY_COLOR = (1 << 7),
336         PASS_TRANSMISSION_COLOR = (1 << 8),
337         PASS_DIFFUSE_INDIRECT = (1 << 9),
338         PASS_GLOSSY_INDIRECT = (1 << 10),
339         PASS_TRANSMISSION_INDIRECT = (1 << 11),
340         PASS_DIFFUSE_DIRECT = (1 << 12),
341         PASS_GLOSSY_DIRECT = (1 << 13),
342         PASS_TRANSMISSION_DIRECT = (1 << 14),
343         PASS_EMISSION = (1 << 15),
344         PASS_BACKGROUND = (1 << 16),
345         PASS_AO = (1 << 17),
346         PASS_SHADOW = (1 << 18),
347         PASS_MOTION = (1 << 19),
348         PASS_MOTION_WEIGHT = (1 << 20),
349         PASS_MIST = (1 << 21),
350         PASS_SUBSURFACE_DIRECT = (1 << 22),
351         PASS_SUBSURFACE_INDIRECT = (1 << 23),
352         PASS_SUBSURFACE_COLOR = (1 << 24),
353         PASS_LIGHT = (1 << 25), /* no real pass, used to force use_light_pass */
354 #ifdef __KERNEL_DEBUG__
355         PASS_BVH_TRAVERSAL_STEPS = (1 << 26),
356         PASS_BVH_TRAVERSED_INSTANCES = (1 << 27),
357         PASS_RAY_BOUNCES = (1 << 28),
358 #endif
359 } PassType;
360
361 #define PASS_ALL (~0)
362
363 #ifdef __PASSES__
364
365 typedef ccl_addr_space struct PathRadiance {
366         int use_light_pass;
367
368         float3 emission;
369         float3 background;
370         float3 ao;
371
372         float3 indirect;
373         float3 direct_throughput;
374         float3 direct_emission;
375
376         float3 color_diffuse;
377         float3 color_glossy;
378         float3 color_transmission;
379         float3 color_subsurface;
380         float3 color_scatter;
381
382         float3 direct_diffuse;
383         float3 direct_glossy;
384         float3 direct_transmission;
385         float3 direct_subsurface;
386         float3 direct_scatter;
387
388         float3 indirect_diffuse;
389         float3 indirect_glossy;
390         float3 indirect_transmission;
391         float3 indirect_subsurface;
392         float3 indirect_scatter;
393
394         float3 path_diffuse;
395         float3 path_glossy;
396         float3 path_transmission;
397         float3 path_subsurface;
398         float3 path_scatter;
399
400         float4 shadow;
401         float mist;
402 } PathRadiance;
403
404 typedef struct BsdfEval {
405         int use_light_pass;
406
407         float3 diffuse;
408         float3 glossy;
409         float3 transmission;
410         float3 transparent;
411         float3 subsurface;
412         float3 scatter;
413 } BsdfEval;
414
415 #else
416
417 typedef ccl_addr_space float3 PathRadiance;
418 typedef float3 BsdfEval;
419
420 #endif
421
422 /* Shader Flag */
423
424 typedef enum ShaderFlag {
425         SHADER_SMOOTH_NORMAL = (1 << 31),
426         SHADER_CAST_SHADOW = (1 << 30),
427         SHADER_AREA_LIGHT = (1 << 29),
428         SHADER_USE_MIS = (1 << 28),
429         SHADER_EXCLUDE_DIFFUSE = (1 << 27),
430         SHADER_EXCLUDE_GLOSSY = (1 << 26),
431         SHADER_EXCLUDE_TRANSMIT = (1 << 25),
432         SHADER_EXCLUDE_CAMERA = (1 << 24),
433         SHADER_EXCLUDE_SCATTER = (1 << 23),
434         SHADER_EXCLUDE_ANY = (SHADER_EXCLUDE_DIFFUSE|SHADER_EXCLUDE_GLOSSY|SHADER_EXCLUDE_TRANSMIT|SHADER_EXCLUDE_CAMERA|SHADER_EXCLUDE_SCATTER),
435
436         SHADER_MASK = ~(SHADER_SMOOTH_NORMAL|SHADER_CAST_SHADOW|SHADER_AREA_LIGHT|SHADER_USE_MIS|SHADER_EXCLUDE_ANY)
437 } ShaderFlag;
438
439 /* Light Type */
440
441 typedef enum LightType {
442         LIGHT_POINT,
443         LIGHT_DISTANT,
444         LIGHT_BACKGROUND,
445         LIGHT_AREA,
446         LIGHT_SPOT,
447         LIGHT_TRIANGLE
448 } LightType;
449
450 /* Camera Type */
451
452 enum CameraType {
453         CAMERA_PERSPECTIVE,
454         CAMERA_ORTHOGRAPHIC,
455         CAMERA_PANORAMA
456 };
457
458 /* Panorama Type */
459
460 enum PanoramaType {
461         PANORAMA_EQUIRECTANGULAR,
462         PANORAMA_MIRRORBALL,
463         PANORAMA_FISHEYE_EQUIDISTANT,
464         PANORAMA_FISHEYE_EQUISOLID
465 };
466
467 /* Differential */
468
469 typedef struct differential3 {
470         float3 dx;
471         float3 dy;
472 } differential3;
473
474 typedef struct differential {
475         float dx;
476         float dy;
477 } differential;
478
479 /* Ray */
480
481 typedef struct Ray {
482 /* TODO(sergey): This is only needed because current AMD
483  * compiler has hard time building the kernel with this
484  * reshuffle. And at the same time reshuffle will cause
485  * less optimal CPU code in certain places.
486  *
487  * We'll get rid of this nasty exception once AMD compiler
488  * is fixed.
489  */
490 #ifndef __KERNEL_OPENCL_AMD__
491         float3 P;               /* origin */
492         float3 D;               /* direction */
493
494         float t;                /* length of the ray */
495         float time;             /* time (for motion blur) */
496 #else
497         float t;                /* length of the ray */
498         float time;             /* time (for motion blur) */
499         float3 P;               /* origin */
500         float3 D;               /* direction */
501 #endif
502
503 #ifdef __RAY_DIFFERENTIALS__
504         differential3 dP;
505         differential3 dD;
506 #endif
507 } Ray;
508
509 /* Intersection */
510
511 typedef ccl_addr_space struct Intersection {
512         float t, u, v;
513         int prim;
514         int object;
515         int type;
516
517 #ifdef __KERNEL_DEBUG__
518         int num_traversal_steps;
519         int num_traversed_instances;
520 #endif
521 } Intersection;
522
523 /* Primitives */
524
525 typedef enum PrimitiveType {
526         PRIMITIVE_NONE = 0,
527         PRIMITIVE_TRIANGLE = 1,
528         PRIMITIVE_MOTION_TRIANGLE = 2,
529         PRIMITIVE_CURVE = 4,
530         PRIMITIVE_MOTION_CURVE = 8,
531
532         PRIMITIVE_ALL_TRIANGLE = (PRIMITIVE_TRIANGLE|PRIMITIVE_MOTION_TRIANGLE),
533         PRIMITIVE_ALL_CURVE = (PRIMITIVE_CURVE|PRIMITIVE_MOTION_CURVE),
534         PRIMITIVE_ALL_MOTION = (PRIMITIVE_MOTION_TRIANGLE|PRIMITIVE_MOTION_CURVE),
535         PRIMITIVE_ALL = (PRIMITIVE_ALL_TRIANGLE|PRIMITIVE_ALL_CURVE),
536
537         /* Total number of different primitives.
538          * NOTE: This is an actual value, not a bitflag.
539          */
540         PRIMITIVE_NUM_TOTAL = 4,
541 } PrimitiveType;
542
543 #define PRIMITIVE_PACK_SEGMENT(type, segment) ((segment << 16) | type)
544 #define PRIMITIVE_UNPACK_SEGMENT(type) (type >> 16)
545
546 /* Attributes */
547
548 #define ATTR_PRIM_TYPES         2
549 #define ATTR_PRIM_CURVE         1
550
551 typedef enum AttributeElement {
552         ATTR_ELEMENT_NONE,
553         ATTR_ELEMENT_OBJECT,
554         ATTR_ELEMENT_MESH,
555         ATTR_ELEMENT_FACE,
556         ATTR_ELEMENT_VERTEX,
557         ATTR_ELEMENT_VERTEX_MOTION,
558         ATTR_ELEMENT_CORNER,
559         ATTR_ELEMENT_CORNER_BYTE,
560         ATTR_ELEMENT_CURVE,
561         ATTR_ELEMENT_CURVE_KEY,
562         ATTR_ELEMENT_CURVE_KEY_MOTION,
563         ATTR_ELEMENT_VOXEL
564 } AttributeElement;
565
566 typedef enum AttributeStandard {
567         ATTR_STD_NONE = 0,
568         ATTR_STD_VERTEX_NORMAL,
569         ATTR_STD_FACE_NORMAL,
570         ATTR_STD_UV,
571         ATTR_STD_UV_TANGENT,
572         ATTR_STD_UV_TANGENT_SIGN,
573         ATTR_STD_GENERATED,
574         ATTR_STD_GENERATED_TRANSFORM,
575         ATTR_STD_POSITION_UNDEFORMED,
576         ATTR_STD_POSITION_UNDISPLACED,
577         ATTR_STD_MOTION_VERTEX_POSITION,
578         ATTR_STD_MOTION_VERTEX_NORMAL,
579         ATTR_STD_PARTICLE,
580         ATTR_STD_CURVE_INTERCEPT,
581         ATTR_STD_PTEX_FACE_ID,
582         ATTR_STD_PTEX_UV,
583         ATTR_STD_VOLUME_DENSITY,
584         ATTR_STD_VOLUME_COLOR,
585         ATTR_STD_VOLUME_FLAME,
586         ATTR_STD_VOLUME_HEAT,
587         ATTR_STD_VOLUME_VELOCITY,
588         ATTR_STD_POINTINESS,
589         ATTR_STD_NUM,
590
591         ATTR_STD_NOT_FOUND = ~0
592 } AttributeStandard;
593
594 /* Closure data */
595
596 #ifdef __MULTI_CLOSURE__
597 #  ifndef __MAX_CLOSURE__
598 #     define MAX_CLOSURE 64
599 #  else
600 #    define MAX_CLOSURE __MAX_CLOSURE__
601 #  endif
602 #else
603 #define MAX_CLOSURE 1
604 #endif
605
606 /* This struct is to be 16 bytes aligned, we also keep some extra precautions:
607  * - All the float3 members are in the beginning of the struct, so compiler
608  *   does not put own padding trying to align this members.
609  * - We make sure OSL pointer is also 16 bytes aligned.
610  */
611 typedef ccl_addr_space struct ShaderClosure {
612         float3 weight;
613         float3 N;
614         float3 T;
615
616         ClosureType type;
617         float sample_weight;
618         float data0;
619         float data1;
620         float data2;
621         int pad1, pad2, pad3;
622
623 #ifdef __OSL__
624         void *prim, *pad4;
625 #endif
626 } ShaderClosure;
627
628 /* Shader Context
629  *
630  * For OSL we recycle a fixed number of contexts for speed */
631
632 typedef enum ShaderContext {
633         SHADER_CONTEXT_MAIN = 0,
634         SHADER_CONTEXT_INDIRECT = 1,
635         SHADER_CONTEXT_EMISSION = 2,
636         SHADER_CONTEXT_SHADOW = 3,
637         SHADER_CONTEXT_SSS = 4,
638         SHADER_CONTEXT_VOLUME = 5,
639         SHADER_CONTEXT_NUM = 6
640 } ShaderContext;
641
642 /* Shader Data
643  *
644  * Main shader state at a point on the surface or in a volume. All coordinates
645  * are in world space. */
646
647 enum ShaderDataFlag {
648         /* runtime flags */
649         SD_BACKFACING     = (1 << 0),   /* backside of surface? */
650         SD_EMISSION       = (1 << 1),   /* have emissive closure? */
651         SD_BSDF           = (1 << 2),   /* have bsdf closure? */
652         SD_BSDF_HAS_EVAL  = (1 << 3),   /* have non-singular bsdf closure? */
653         SD_BSSRDF         = (1 << 4),   /* have bssrdf */
654         SD_HOLDOUT        = (1 << 5),   /* have holdout closure? */
655         SD_ABSORPTION     = (1 << 6),   /* have volume absorption closure? */
656         SD_SCATTER        = (1 << 7),   /* have volume phase closure? */
657         SD_AO             = (1 << 8),   /* have ao closure? */
658         SD_TRANSPARENT    = (1 << 9),  /* have transparent closure? */
659
660         SD_CLOSURE_FLAGS = (SD_EMISSION|SD_BSDF|SD_BSDF_HAS_EVAL|SD_BSSRDF|
661                             SD_HOLDOUT|SD_ABSORPTION|SD_SCATTER|SD_AO),
662
663         /* shader flags */
664         SD_USE_MIS                = (1 << 10),  /* direct light sample */
665         SD_HAS_TRANSPARENT_SHADOW = (1 << 11),  /* has transparent shadow */
666         SD_HAS_VOLUME             = (1 << 12),  /* has volume shader */
667         SD_HAS_ONLY_VOLUME        = (1 << 13),  /* has only volume shader, no surface */
668         SD_HETEROGENEOUS_VOLUME   = (1 << 14),  /* has heterogeneous volume */
669         SD_HAS_BSSRDF_BUMP        = (1 << 15),  /* bssrdf normal uses bump */
670         SD_VOLUME_EQUIANGULAR     = (1 << 16),  /* use equiangular sampling */
671         SD_VOLUME_MIS             = (1 << 17),  /* use multiple importance sampling */
672         SD_VOLUME_CUBIC           = (1 << 18),  /* use cubic interpolation for voxels */
673         SD_HAS_BUMP               = (1 << 19),  /* has data connected to the displacement input */
674
675         SD_SHADER_FLAGS = (SD_USE_MIS|SD_HAS_TRANSPARENT_SHADOW|SD_HAS_VOLUME|
676                            SD_HAS_ONLY_VOLUME|SD_HETEROGENEOUS_VOLUME|
677                            SD_HAS_BSSRDF_BUMP|SD_VOLUME_EQUIANGULAR|SD_VOLUME_MIS|
678                            SD_VOLUME_CUBIC|SD_HAS_BUMP),
679
680         /* object flags */
681         SD_HOLDOUT_MASK             = (1 << 20),  /* holdout for camera rays */
682         SD_OBJECT_MOTION            = (1 << 21),  /* has object motion blur */
683         SD_TRANSFORM_APPLIED        = (1 << 22),  /* vertices have transform applied */
684         SD_NEGATIVE_SCALE_APPLIED   = (1 << 23),  /* vertices have negative scale applied */
685         SD_OBJECT_HAS_VOLUME        = (1 << 24),  /* object has a volume shader */
686         SD_OBJECT_INTERSECTS_VOLUME = (1 << 25),  /* object intersects AABB of an object with volume shader */
687         SD_OBJECT_HAS_VERTEX_MOTION = (1 << 26),  /* has position for motion vertices */
688
689         SD_OBJECT_FLAGS = (SD_HOLDOUT_MASK|SD_OBJECT_MOTION|SD_TRANSFORM_APPLIED|
690                            SD_NEGATIVE_SCALE_APPLIED|SD_OBJECT_HAS_VOLUME|
691                            SD_OBJECT_INTERSECTS_VOLUME)
692 };
693
694 struct KernelGlobals;
695
696 #ifdef __SPLIT_KERNEL__
697 #define SD_VAR(type, what) ccl_global type *what;
698 #define SD_CLOSURE_VAR(type, what, max_closure) type *what;
699 #define TIDX (get_global_id(1) * get_global_size(0) + get_global_id(0))
700 #define ccl_fetch(s, t) (s->t[TIDX])
701 #define ccl_fetch_array(s, t, index) (&s->t[TIDX * MAX_CLOSURE + index])
702 #else
703 #define SD_VAR(type, what) type what;
704 #define SD_CLOSURE_VAR(type, what, max_closure) type what[max_closure];
705 #define ccl_fetch(s, t) (s->t)
706 #define ccl_fetch_array(s, t, index) (&s->t[index])
707 #endif
708
709 typedef ccl_addr_space struct ShaderData {
710
711 #include "kernel_shaderdata_vars.h"
712
713 } ShaderData;
714
715 /* Path State */
716
717 #ifdef __VOLUME__
718 typedef struct VolumeStack {
719         int object;
720         int shader;
721 } VolumeStack;
722 #endif
723
724 typedef struct PathState {
725         /* see enum PathRayFlag */
726         int flag;          
727
728         /* random number generator state */
729         int rng_offset;                 /* dimension offset */
730         int sample;                     /* path sample number */
731         int num_samples;                /* total number of times this path will be sampled */
732
733         /* bounce counting */
734         int bounce;
735         int diffuse_bounce;
736         int glossy_bounce;
737         int transmission_bounce;
738         int transparent_bounce;
739
740         /* multiple importance sampling */
741         float min_ray_pdf; /* smallest bounce pdf over entire path up to now */
742         float ray_pdf;     /* last bounce pdf */
743 #ifdef __LAMP_MIS__
744         float ray_t;       /* accumulated distance through transparent surfaces */
745 #endif
746
747         /* volume rendering */
748 #ifdef __VOLUME__
749         int volume_bounce;
750         RNG rng_congruential;
751         VolumeStack volume_stack[VOLUME_STACK_SIZE];
752 #endif
753 } PathState;
754
755 /* Subsurface */
756
757 /* Struct to gather multiple SSS hits. */
758 struct SubsurfaceIntersection
759 {
760         Ray ray;
761         float3 weight[BSSRDF_MAX_HITS];
762
763         int num_hits;
764         Intersection hits[BSSRDF_MAX_HITS];
765         float3 Ng[BSSRDF_MAX_HITS];
766 };
767
768 /* Struct to gather SSS indirect rays and delay tracing them. */
769 struct SubsurfaceIndirectRays
770 {
771         bool need_update_volume_stack;
772         PathState state;
773
774         int num_rays;
775         Ray rays[BSSRDF_MAX_HITS];
776         float3 throughputs[BSSRDF_MAX_HITS];
777 };
778
779 /* Constant Kernel Data
780  *
781  * These structs are passed from CPU to various devices, and the struct layout
782  * must match exactly. Structs are padded to ensure 16 byte alignment, and we
783  * do not use float3 because its size may not be the same on all devices. */
784
785 typedef struct KernelCamera {
786         /* type */
787         int type;
788
789         /* panorama */
790         int panorama_type;
791         float fisheye_fov;
792         float fisheye_lens;
793         float4 equirectangular_range;
794
795         /* matrices */
796         Transform cameratoworld;
797         Transform rastertocamera;
798
799         /* differentials */
800         float4 dx;
801         float4 dy;
802
803         /* depth of field */
804         float aperturesize;
805         float blades;
806         float bladesrotation;
807         float focaldistance;
808
809         /* motion blur */
810         float shuttertime;
811         int have_motion, have_perspective_motion;
812
813         /* clipping */
814         float nearclip;
815         float cliplength;
816
817         /* sensor size */
818         float sensorwidth;
819         float sensorheight;
820
821         /* render size */
822         float width, height;
823         int resolution;
824
825         /* anamorphic lens bokeh */
826         float inv_aperture_ratio;
827
828         int is_inside_volume;
829
830         /* more matrices */
831         Transform screentoworld;
832         Transform rastertoworld;
833         /* work around cuda sm 2.0 crash, this seems to
834          * cross some limit in combination with motion 
835          * Transform ndctoworld; */
836         Transform worldtoscreen;
837         Transform worldtoraster;
838         Transform worldtondc;
839         Transform worldtocamera;
840
841         MotionTransform motion;
842
843         /* Denotes changes in the projective matrix, namely in rastertocamera.
844          * Used for camera zoom motion blur,
845          */
846         PerspectiveMotionTransform perspective_motion;
847
848         int shutter_table_offset;
849         int pad;
850 } KernelCamera;
851
852 typedef struct KernelFilm {
853         float exposure;
854         int pass_flag;
855         int pass_stride;
856         int use_light_pass;
857
858         int pass_combined;
859         int pass_depth;
860         int pass_normal;
861         int pass_motion;
862
863         int pass_motion_weight;
864         int pass_uv;
865         int pass_object_id;
866         int pass_material_id;
867
868         int pass_diffuse_color;
869         int pass_glossy_color;
870         int pass_transmission_color;
871         int pass_subsurface_color;
872         
873         int pass_diffuse_indirect;
874         int pass_glossy_indirect;
875         int pass_transmission_indirect;
876         int pass_subsurface_indirect;
877         
878         int pass_diffuse_direct;
879         int pass_glossy_direct;
880         int pass_transmission_direct;
881         int pass_subsurface_direct;
882         
883         int pass_emission;
884         int pass_background;
885         int pass_ao;
886         float pass_alpha_threshold;
887
888         int pass_shadow;
889         float pass_shadow_scale;
890         int filter_table_offset;
891         int pass_pad2;
892
893         int pass_mist;
894         float mist_start;
895         float mist_inv_depth;
896         float mist_falloff;
897
898 #ifdef __KERNEL_DEBUG__
899         int pass_bvh_traversal_steps;
900         int pass_bvh_traversed_instances;
901         int pass_ray_bounces;
902         int pass_pad3;
903 #endif
904 } KernelFilm;
905
906 typedef struct KernelBackground {
907         /* only shader index */
908         int surface_shader;
909         int volume_shader;
910         int transparent;
911         int pad;
912
913         /* ambient occlusion */
914         float ao_factor;
915         float ao_distance;
916         float ao_pad1, ao_pad2;
917 } KernelBackground;
918
919 typedef struct KernelIntegrator {
920         /* emission */
921         int use_direct_light;
922         int use_ambient_occlusion;
923         int num_distribution;
924         int num_all_lights;
925         float pdf_triangles;
926         float pdf_lights;
927         float inv_pdf_lights;
928         int pdf_background_res;
929
930         /* light portals */
931         float portal_pdf;
932         int num_portals;
933         int portal_offset;
934
935         /* bounces */
936         int min_bounce;
937         int max_bounce;
938
939         int max_diffuse_bounce;
940         int max_glossy_bounce;
941         int max_transmission_bounce;
942         int max_volume_bounce;
943
944         /* transparent */
945         int transparent_min_bounce;
946         int transparent_max_bounce;
947         int transparent_shadows;
948
949         /* caustics */
950         int caustics_reflective;
951         int caustics_refractive;
952         float filter_glossy;
953
954         /* seed */
955         int seed;
956
957         /* render layer */
958         int layer_flag;
959
960         /* clamp */
961         float sample_clamp_direct;
962         float sample_clamp_indirect;
963
964         /* branched path */
965         int branched;
966         int diffuse_samples;
967         int glossy_samples;
968         int transmission_samples;
969         int ao_samples;
970         int mesh_light_samples;
971         int subsurface_samples;
972         int sample_all_lights_direct;
973         int sample_all_lights_indirect;
974
975         /* mis */
976         int use_lamp_mis;
977
978         /* sampler */
979         int sampling_pattern;
980         int aa_samples;
981
982         /* volume render */
983         int use_volumes;
984         int volume_max_steps;
985         float volume_step_size;
986         int volume_samples;
987
988         int pad;
989 } KernelIntegrator;
990
991 typedef struct KernelBVH {
992         /* root node */
993         int root;
994         int attributes_map_stride;
995         int have_motion;
996         int have_curves;
997         int have_instancing;
998         int use_qbvh;
999         int pad1, pad2;
1000 } KernelBVH;
1001
1002 typedef enum CurveFlag {
1003         /* runtime flags */
1004         CURVE_KN_BACKFACING = 1,                                /* backside of cylinder? */
1005         CURVE_KN_ENCLOSEFILTER = 2,                             /* don't consider strands surrounding start point? */
1006         CURVE_KN_INTERPOLATE = 4,                               /* render as a curve? */
1007         CURVE_KN_ACCURATE = 8,                                  /* use accurate intersections test? */
1008         CURVE_KN_INTERSECTCORRECTION = 16,              /* correct for width after determing closest midpoint? */
1009         CURVE_KN_TRUETANGENTGNORMAL = 32,               /* use tangent normal for geometry? */
1010         CURVE_KN_RIBBONS = 64,                                  /* use flat curve ribbons */
1011 } CurveFlag;
1012
1013 typedef struct KernelCurves {
1014         int curveflags;
1015         int subdivisions;
1016
1017         float minimum_width;
1018         float maximum_width;
1019 } KernelCurves;
1020
1021 typedef struct KernelTables {
1022         int beckmann_offset;
1023         int pad1, pad2, pad3;
1024 } KernelTables;
1025
1026 typedef struct KernelData {
1027         KernelCamera cam;
1028         KernelFilm film;
1029         KernelBackground background;
1030         KernelIntegrator integrator;
1031         KernelBVH bvh;
1032         KernelCurves curve;
1033         KernelTables tables;
1034 } KernelData;
1035
1036 #ifdef __KERNEL_DEBUG__
1037 typedef ccl_addr_space struct DebugData {
1038         // Total number of BVH node traversal steps and primitives intersections
1039         // for the camera rays.
1040         int num_bvh_traversal_steps;
1041         int num_bvh_traversed_instances;
1042         int num_ray_bounces;
1043 } DebugData;
1044 #endif
1045
1046 /* Declarations required for split kernel */
1047
1048 /* Macro for queues */
1049 /* Value marking queue's empty slot */
1050 #define QUEUE_EMPTY_SLOT -1
1051
1052 /*
1053 * Queue 1 - Active rays
1054 * Queue 2 - Background queue
1055 * Queue 3 - Shadow ray cast kernel - AO
1056 * Queeu 4 - Shadow ray cast kernel - direct lighting
1057 */
1058 #define NUM_QUEUES 4
1059
1060 /* Queue names */
1061 enum QueueNumber {
1062         QUEUE_ACTIVE_AND_REGENERATED_RAYS = 0,     /* All active rays and regenerated rays are enqueued here. */
1063         QUEUE_HITBG_BUFF_UPDATE_TOREGEN_RAYS = 1,  /* All
1064                                                     * 1. Background-hit rays,
1065                                                     * 2. Rays that has exited path-iteration but needs to update output buffer
1066                                                     * 3. Rays to be regenerated
1067                                                     * are enqueued here.
1068                                                     */
1069         QUEUE_SHADOW_RAY_CAST_AO_RAYS = 2,         /* All rays for which a shadow ray should be cast to determine radiance
1070                                                     * contribution for AO are enqueued here.
1071                                                     */
1072         QUEUE_SHADOW_RAY_CAST_DL_RAYS = 3,         /* All rays for which a shadow ray should be cast to determine radiance
1073                                                     * contributing for direct lighting are enqueued here.
1074                                                     */
1075 };
1076
1077 /* We use RAY_STATE_MASK to get ray_state (enums 0 to 5) */
1078 #define RAY_STATE_MASK 0x007
1079 #define RAY_FLAG_MASK 0x0F8
1080 enum RayState {
1081         RAY_ACTIVE = 0,             // Denotes ray is actively involved in path-iteration
1082         RAY_INACTIVE = 1,           // Denotes ray has completed processing all samples and is inactive
1083         RAY_UPDATE_BUFFER = 2,      // Denoted ray has exited path-iteration and needs to update output buffer
1084         RAY_HIT_BACKGROUND = 3,     // Donotes ray has hit background
1085         RAY_TO_REGENERATE = 4,      // Denotes ray has to be regenerated
1086         RAY_REGENERATED = 5,        // Denotes ray has been regenerated
1087         RAY_SKIP_DL = 6,            // Denotes ray should skip direct lighting
1088         RAY_SHADOW_RAY_CAST_AO = 16, // Flag's ray has to execute shadow blocked function in AO part
1089         RAY_SHADOW_RAY_CAST_DL = 32 // Flag's ray has to execute shadow blocked function in direct lighting part
1090 };
1091
1092 #define ASSIGN_RAY_STATE(ray_state, ray_index, state) (ray_state[ray_index] = ((ray_state[ray_index] & RAY_FLAG_MASK) | state))
1093 #define IS_STATE(ray_state, ray_index, state) ((ray_state[ray_index] & RAY_STATE_MASK) == state)
1094 #define ADD_RAY_FLAG(ray_state, ray_index, flag) (ray_state[ray_index] = (ray_state[ray_index] | flag))
1095 #define REMOVE_RAY_FLAG(ray_state, ray_index, flag) (ray_state[ray_index] = (ray_state[ray_index] & (~flag)))
1096 #define IS_FLAG(ray_state, ray_index, flag) (ray_state[ray_index] & flag)
1097
1098 CCL_NAMESPACE_END
1099
1100 #endif /*  __KERNEL_TYPES_H__ */
1101