Cycles: Expose image image extension mapping to the image manager
[blender.git] / intern / cycles / kernel / kernel_light.h
1 /*
2  * Copyright 2011-2013 Blender Foundation
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 CCL_NAMESPACE_BEGIN
18
19 /* Light Sample result */
20
21 typedef struct LightSample {
22         float3 P;                       /* position on light, or direction for distant light */
23         float3 Ng;                      /* normal on light */
24         float3 D;                       /* direction from shading point to light */
25         float t;                        /* distance to light (FLT_MAX for distant light) */
26         float u, v;                     /* parametric coordinate on primitive */
27         float pdf;                      /* light sampling probability density function */
28         float eval_fac;         /* intensity multiplier */
29         int object;                     /* object id for triangle/curve lights */
30         int prim;                       /* primitive id for triangle/curve lights */
31         int shader;                     /* shader id */
32         int lamp;                       /* lamp id */
33         LightType type;         /* type of light */
34 } LightSample;
35
36 /* Area light sampling */
37
38 /* Uses the following paper:
39  *
40  * Carlos Urena et al.
41  * An Area-Preserving Parametrization for Spherical Rectangles.
42  *
43  * https://www.solidangle.com/research/egsr2013_spherical_rectangle.pdf
44  *
45  * Note: light_p is modified when sample_coord is true.
46  */
47 ccl_device float area_light_sample(float3 P,
48                                    float3 *light_p,
49                                    float3 axisu, float3 axisv,
50                                    float randu, float randv,
51                                    bool sample_coord)
52 {
53         /* In our name system we're using P for the center,
54         * which is o in the paper.
55         */
56
57         float3 corner = *light_p - axisu * 0.5f - axisv * 0.5f;
58         float axisu_len, axisv_len;
59         /* Compute local reference system R. */
60         float3 x = normalize_len(axisu, &axisu_len);
61         float3 y = normalize_len(axisv, &axisv_len);
62         float3 z = cross(x, y);
63         /* Compute rectangle coords in local reference system. */
64         float3 dir = corner - P;
65         float z0 = dot(dir, z);
66         /* Flip 'z' to make it point against Q. */
67         if(z0 > 0.0f) {
68                 z *= -1.0f;
69                 z0 *= -1.0f;
70         }
71         float x0 = dot(dir, x);
72         float y0 = dot(dir, y);
73         float x1 = x0 + axisu_len;
74         float y1 = y0 + axisv_len;
75         /* Create vectors to four vertices. */
76         float3 v00 = make_float3(x0, y0, z0);
77         float3 v01 = make_float3(x0, y1, z0);
78         float3 v10 = make_float3(x1, y0, z0);
79         float3 v11 = make_float3(x1, y1, z0);
80         /* Compute normals to edges. */
81         float3 n0 = normalize(cross(v00, v10));
82         float3 n1 = normalize(cross(v10, v11));
83         float3 n2 = normalize(cross(v11, v01));
84         float3 n3 = normalize(cross(v01, v00));
85         /* Compute internal angles (gamma_i). */
86         float g0 = safe_acosf(-dot(n0, n1));
87         float g1 = safe_acosf(-dot(n1, n2));
88         float g2 = safe_acosf(-dot(n2, n3));
89         float g3 = safe_acosf(-dot(n3, n0));
90         /* Compute predefined constants. */
91         float b0 = n0.z;
92         float b1 = n2.z;
93         float b0sq = b0 * b0;
94         float k = M_2PI_F - g2 - g3;
95         /* Compute solid angle from internal angles. */
96         float S = g0 + g1 - k;
97
98         if(sample_coord) {
99                 /* Compute cu. */
100                 float au = randu * S + k;
101                 float fu = (cosf(au) * b0 - b1) / sinf(au);
102                 float cu = 1.0f / sqrtf(fu * fu + b0sq) * (fu > 0.0f ? 1.0f : -1.0f);
103                 cu = clamp(cu, -1.0f, 1.0f);
104                 /* Compute xu. */
105                 float xu = -(cu * z0) / sqrtf(1.0f - cu * cu);
106                 xu = clamp(xu, x0, x1);
107                 /* Compute yv. */
108                 float z0sq = z0 * z0;
109                 float y0sq = y0 * y0;
110                 float y1sq = y1 * y1;
111                 float d = sqrtf(xu * xu + z0sq);
112                 float h0 = y0 / sqrtf(d * d + y0sq);
113                 float h1 = y1 / sqrtf(d * d + y1sq);
114                 float hv = h0 + randv * (h1 - h0), hv2 = hv * hv;
115                 float yv = (hv2 < 1.0f - 1e-6f) ? (hv * d) / sqrtf(1.0f - hv2) : y1;
116
117                 /* Transform (xu, yv, z0) to world coords. */
118                 *light_p = P + xu * x + yv * y + z0 * z;
119         }
120
121         /* return pdf */
122         if(S != 0.0f)
123                 return 1.0f / S;
124         else
125                 return 0.0f;
126 }
127
128 /* Background Light */
129
130 #ifdef __BACKGROUND_MIS__
131
132 /* TODO(sergey): In theory it should be all fine to use noinline for all
133  * devices, but we're so close to the release so better not screw things
134  * up for CPU at least.
135  */
136 #ifdef __KERNEL_GPU__
137 ccl_device_noinline
138 #else
139 ccl_device
140 #endif
141 float3 background_map_sample(KernelGlobals *kg, float randu, float randv, float *pdf)
142 {
143         /* for the following, the CDF values are actually a pair of floats, with the
144          * function value as X and the actual CDF as Y.  The last entry's function
145          * value is the CDF total. */
146         int res = kernel_data.integrator.pdf_background_res;
147         int cdf_count = res + 1;
148
149         /* this is basically std::lower_bound as used by pbrt */
150         int first = 0;
151         int count = res;
152
153         while(count > 0) {
154                 int step = count >> 1;
155                 int middle = first + step;
156
157                 if(kernel_tex_fetch(__light_background_marginal_cdf, middle).y < randv) {
158                         first = middle + 1;
159                         count -= step + 1;
160                 }
161                 else
162                         count = step;
163         }
164
165         int index_v = max(0, first - 1);
166         kernel_assert(index_v >= 0 && index_v < res);
167
168         float2 cdf_v = kernel_tex_fetch(__light_background_marginal_cdf, index_v);
169         float2 cdf_next_v = kernel_tex_fetch(__light_background_marginal_cdf, index_v + 1);
170         float2 cdf_last_v = kernel_tex_fetch(__light_background_marginal_cdf, res);
171
172         /* importance-sampled V direction */
173         float dv = (randv - cdf_v.y) / (cdf_next_v.y - cdf_v.y);
174         float v = (index_v + dv) / res;
175
176         /* this is basically std::lower_bound as used by pbrt */
177         first = 0;
178         count = res;
179         while(count > 0) {
180                 int step = count >> 1;
181                 int middle = first + step;
182
183                 if(kernel_tex_fetch(__light_background_conditional_cdf, index_v * cdf_count + middle).y < randu) {
184                         first = middle + 1;
185                         count -= step + 1;
186                 }
187                 else
188                         count = step;
189         }
190
191         int index_u = max(0, first - 1);
192         kernel_assert(index_u >= 0 && index_u < res);
193
194         float2 cdf_u = kernel_tex_fetch(__light_background_conditional_cdf, index_v * cdf_count + index_u);
195         float2 cdf_next_u = kernel_tex_fetch(__light_background_conditional_cdf, index_v * cdf_count + index_u + 1);
196         float2 cdf_last_u = kernel_tex_fetch(__light_background_conditional_cdf, index_v * cdf_count + res);
197
198         /* importance-sampled U direction */
199         float du = (randu - cdf_u.y) / (cdf_next_u.y - cdf_u.y);
200         float u = (index_u + du) / res;
201
202         /* compute pdf */
203         float denom = cdf_last_u.x * cdf_last_v.x;
204         float sin_theta = sinf(M_PI_F * v);
205
206         if(sin_theta == 0.0f || denom == 0.0f)
207                 *pdf = 0.0f;
208         else
209                 *pdf = (cdf_u.x * cdf_v.x)/(M_2PI_F * M_PI_F * sin_theta * denom);
210
211         /* compute direction */
212         return equirectangular_to_direction(u, v);
213 }
214
215 /* TODO(sergey): Same as above, after the release we should consider using
216  * 'noinline' for all devices.
217  */
218 #ifdef __KERNEL_GPU__
219 ccl_device_noinline
220 #else
221 ccl_device
222 #endif
223 float background_map_pdf(KernelGlobals *kg, float3 direction)
224 {
225         float2 uv = direction_to_equirectangular(direction);
226         int res = kernel_data.integrator.pdf_background_res;
227
228         float sin_theta = sinf(uv.y * M_PI_F);
229
230         if(sin_theta == 0.0f)
231                 return 0.0f;
232
233         int index_u = clamp(float_to_int(uv.x * res), 0, res - 1);
234         int index_v = clamp(float_to_int(uv.y * res), 0, res - 1);
235
236         /* pdfs in V direction */
237         float2 cdf_last_u = kernel_tex_fetch(__light_background_conditional_cdf, index_v * (res + 1) + res);
238         float2 cdf_last_v = kernel_tex_fetch(__light_background_marginal_cdf, res);
239
240         float denom = cdf_last_u.x * cdf_last_v.x;
241
242         if(denom == 0.0f)
243                 return 0.0f;
244
245         /* pdfs in U direction */
246         float2 cdf_u = kernel_tex_fetch(__light_background_conditional_cdf, index_v * (res + 1) + index_u);
247         float2 cdf_v = kernel_tex_fetch(__light_background_marginal_cdf, index_v);
248
249         return (cdf_u.x * cdf_v.x)/(M_2PI_F * M_PI_F * sin_theta * denom);
250 }
251
252 ccl_device_inline bool background_portal_data_fetch_and_check_side(KernelGlobals *kg,
253                                                                    float3 P,
254                                                                    int index,
255                                                                    float3 *lightpos,
256                                                                    float3 *dir)
257 {
258         float4 data0 = kernel_tex_fetch(__light_data, (index + kernel_data.integrator.portal_offset)*LIGHT_SIZE + 0);
259         float4 data3 = kernel_tex_fetch(__light_data, (index + kernel_data.integrator.portal_offset)*LIGHT_SIZE + 3);
260
261         *lightpos = make_float3(data0.y, data0.z, data0.w);
262         *dir = make_float3(data3.y, data3.z, data3.w);
263
264         /* Check whether portal is on the right side. */
265         if(dot(*dir, P - *lightpos) > 1e-5f)
266                 return true;
267
268         return false;
269 }
270
271 ccl_device float background_portal_pdf(KernelGlobals *kg,
272                                        float3 P,
273                                        float3 direction,
274                                        int ignore_portal,
275                                        bool *is_possible)
276 {
277         float portal_pdf = 0.0f;
278
279         for(int p = 0; p < kernel_data.integrator.num_portals; p++) {
280                 if(p == ignore_portal)
281                         continue;
282
283                 float3 lightpos, dir;
284                 if(!background_portal_data_fetch_and_check_side(kg, P, p, &lightpos, &dir))
285                         continue;
286
287                 if(is_possible) {
288                         /* There's a portal that could be sampled from this position. */
289                         *is_possible = true;
290                 }
291
292                 float t = -(dot(P, dir) - dot(lightpos, dir)) / dot(direction, dir);
293                 if(t <= 1e-5f) {
294                         /* Either behind the portal or too close. */
295                         continue;
296                 }
297
298                 float4 data1 = kernel_tex_fetch(__light_data, (p + kernel_data.integrator.portal_offset)*LIGHT_SIZE + 1);
299                 float4 data2 = kernel_tex_fetch(__light_data, (p + kernel_data.integrator.portal_offset)*LIGHT_SIZE + 2);
300
301                 float3 axisu = make_float3(data1.y, data1.z, data1.w);
302                 float3 axisv = make_float3(data2.y, data2.z, data2.w);
303
304                 float3 hit = P + t*direction;
305                 float3 inplane = hit - lightpos;
306                 /* Skip if the the ray doesn't pass through portal. */
307                 if(fabsf(dot(inplane, axisu) / dot(axisu, axisu)) > 0.5f)
308                         continue;
309                 if(fabsf(dot(inplane, axisv) / dot(axisv, axisv)) > 0.5f)
310                         continue;
311
312                 portal_pdf += area_light_sample(P, &lightpos, axisu, axisv, 0.0f, 0.0f, false);
313         }
314
315         return kernel_data.integrator.num_portals? portal_pdf / kernel_data.integrator.num_portals: 0.0f;
316 }
317
318 ccl_device int background_num_possible_portals(KernelGlobals *kg, float3 P)
319 {
320         int num_possible_portals = 0;
321         for(int p = 0; p < kernel_data.integrator.num_portals; p++) {
322                 float3 lightpos, dir;
323                 if(background_portal_data_fetch_and_check_side(kg, P, p, &lightpos, &dir))
324                         num_possible_portals++;
325         }
326         return num_possible_portals;
327 }
328
329 ccl_device float3 background_portal_sample(KernelGlobals *kg,
330                                            float3 P,
331                                            float randu,
332                                            float randv,
333                                            int num_possible,
334                                            int *sampled_portal,
335                                            float *pdf)
336 {
337         /* Pick a portal, then re-normalize randv. */
338         randv *= num_possible;
339         int portal = (int)randv;
340         randv -= portal;
341
342         /* TODO(sergey): Some smarter way of finding portal to sample
343          * is welcome.
344          */
345         for(int p = 0; p < kernel_data.integrator.num_portals; p++) {
346                 /* Search for the sampled portal. */
347                 float3 lightpos, dir;
348                 if(!background_portal_data_fetch_and_check_side(kg, P, p, &lightpos, &dir))
349                         continue;
350
351                 if(portal == 0) {
352                         /* p is the portal to be sampled. */
353                         float4 data1 = kernel_tex_fetch(__light_data, (p + kernel_data.integrator.portal_offset)*LIGHT_SIZE + 1);
354                         float4 data2 = kernel_tex_fetch(__light_data, (p + kernel_data.integrator.portal_offset)*LIGHT_SIZE + 2);
355                         float3 axisu = make_float3(data1.y, data1.z, data1.w);
356                         float3 axisv = make_float3(data2.y, data2.z, data2.w);
357
358                         *pdf = area_light_sample(P, &lightpos,
359                                                  axisu, axisv,
360                                                  randu, randv,
361                                                  true);
362
363                         *pdf /= num_possible;
364                         *sampled_portal = p;
365                         return normalize(lightpos - P);
366                 }
367
368                 portal--;
369         }
370
371         return make_float3(0.0f, 0.0f, 0.0f);
372 }
373
374 ccl_device float3 background_light_sample(KernelGlobals *kg, float3 P, float randu, float randv, float *pdf)
375 {
376         /* Probability of sampling portals instead of the map. */
377         float portal_sampling_pdf = kernel_data.integrator.portal_pdf;
378
379         /* Check if there are portals in the scene which we can sample. */
380         if(portal_sampling_pdf > 0.0f) {
381                 int num_portals = background_num_possible_portals(kg, P);
382                 if(num_portals > 0) {
383                         if(portal_sampling_pdf == 1.0f || randu < portal_sampling_pdf) {
384                                 if(portal_sampling_pdf < 1.0f) {
385                                         randu /= portal_sampling_pdf;
386                                 }
387                                 int portal;
388                                 float3 D = background_portal_sample(kg, P, randu, randv, num_portals, &portal, pdf);
389                                 if(num_portals > 1) {
390                                         /* Ignore the chosen portal, its pdf is already included. */
391                                         *pdf += background_portal_pdf(kg, P, D, portal, NULL);
392                                 }
393                                 /* We could also have sampled the map, so combine with MIS. */
394                                 if(portal_sampling_pdf < 1.0f) {
395                                         float cdf_pdf = background_map_pdf(kg, D);
396                                         *pdf = (portal_sampling_pdf * (*pdf)
397                                              + (1.0f - portal_sampling_pdf) * cdf_pdf);
398                                 }
399                                 return D;
400                         } else {
401                                 /* Sample map, but with nonzero portal_sampling_pdf for MIS. */
402                                 randu = (randu - portal_sampling_pdf) / (1.0f - portal_sampling_pdf);
403                         }
404                 } else {
405                         /* We can't sample a portal.
406                          * Check if we can sample the map instead.
407                          */
408                         if(portal_sampling_pdf == 1.0f) {
409                                 /* Use uniform as a fallback if we can't sample the map. */
410                                 *pdf = 1.0f / M_4PI_F;
411                                 return sample_uniform_sphere(randu, randv);
412                         }
413                         else {
414                                 portal_sampling_pdf = 0.0f;
415                         }
416                 }
417         }
418
419         float3 D = background_map_sample(kg, randu, randv, pdf);
420         /* Use MIS if portals could be sampled as well. */
421         if(portal_sampling_pdf > 0.0f) {
422                 float portal_pdf = background_portal_pdf(kg, P, D, -1, NULL);
423                 *pdf = (portal_sampling_pdf * portal_pdf
424                      + (1.0f - portal_sampling_pdf) * (*pdf));
425         }
426         return D;
427 }
428
429 ccl_device float background_light_pdf(KernelGlobals *kg, float3 P, float3 direction)
430 {
431         /* Probability of sampling portals instead of the map. */
432         float portal_sampling_pdf = kernel_data.integrator.portal_pdf;
433
434         if(portal_sampling_pdf > 0.0f) {
435                 bool is_possible = false;
436                 float portal_pdf = background_portal_pdf(kg, P, direction, -1, &is_possible);
437                 if(portal_pdf == 0.0f) {
438                         if(portal_sampling_pdf == 1.0f) {
439                                 /* If there are no possible portals at this point,
440                                  * the fallback sampling would have been used.
441                                  * Otherwise, the direction would not be sampled at all => pdf = 0
442                                  */
443                                 return is_possible? 0.0f: kernel_data.integrator.pdf_lights / M_4PI_F;
444                         }
445                         else {
446                                 /* We can only sample the map. */
447                                 return background_map_pdf(kg, direction) * kernel_data.integrator.pdf_lights;
448                         }
449                 } else {
450                         if(portal_sampling_pdf == 1.0f) {
451                                 /* We can only sample portals. */
452                                 return portal_pdf * kernel_data.integrator.pdf_lights;
453                         }
454                         else {
455                                 /* We can sample both, so combine with MIS. */
456                                 return (background_map_pdf(kg, direction) * (1.0f - portal_sampling_pdf)
457                                       + portal_pdf * portal_sampling_pdf) * kernel_data.integrator.pdf_lights;
458                         }
459                 }
460         }
461
462         /* No portals in the scene, so must sample the map.
463          * At least one of them is always possible if we have a LIGHT_BACKGROUND.
464          */
465         return background_map_pdf(kg, direction) * kernel_data.integrator.pdf_lights;
466 }
467 #endif
468
469 /* Regular Light */
470
471 ccl_device float3 disk_light_sample(float3 v, float randu, float randv)
472 {
473         float3 ru, rv;
474
475         make_orthonormals(v, &ru, &rv);
476         to_unit_disk(&randu, &randv);
477
478         return ru*randu + rv*randv;
479 }
480
481 ccl_device float3 distant_light_sample(float3 D, float radius, float randu, float randv)
482 {
483         return normalize(D + disk_light_sample(D, randu, randv)*radius);
484 }
485
486 ccl_device float3 sphere_light_sample(float3 P, float3 center, float radius, float randu, float randv)
487 {
488         return disk_light_sample(normalize(P - center), randu, randv)*radius;
489 }
490
491 ccl_device float spot_light_attenuation(float4 data1, float4 data2, LightSample *ls)
492 {
493         float3 dir = make_float3(data2.y, data2.z, data2.w);
494         float3 I = ls->Ng;
495
496         float spot_angle = data1.w;
497         float spot_smooth = data2.x;
498
499         float attenuation = dot(dir, I);
500
501         if(attenuation <= spot_angle) {
502                 attenuation = 0.0f;
503         }
504         else {
505                 float t = attenuation - spot_angle;
506
507                 if(t < spot_smooth && spot_smooth != 0.0f)
508                         attenuation *= smoothstepf(t/spot_smooth);
509         }
510
511         return attenuation;
512 }
513
514 ccl_device float lamp_light_pdf(KernelGlobals *kg, const float3 Ng, const float3 I, float t)
515 {
516         float cos_pi = dot(Ng, I);
517
518         if(cos_pi <= 0.0f)
519                 return 0.0f;
520         
521         return t*t/cos_pi;
522 }
523
524 ccl_device void lamp_light_sample(KernelGlobals *kg, int lamp,
525         float randu, float randv, float3 P, LightSample *ls)
526 {
527         float4 data0 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 0);
528         float4 data1 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 1);
529
530         LightType type = (LightType)__float_as_int(data0.x);
531         ls->type = type;
532         ls->shader = __float_as_int(data1.x);
533         ls->object = PRIM_NONE;
534         ls->prim = PRIM_NONE;
535         ls->lamp = lamp;
536         ls->u = randu;
537         ls->v = randv;
538
539         if(type == LIGHT_DISTANT) {
540                 /* distant light */
541                 float3 lightD = make_float3(data0.y, data0.z, data0.w);
542                 float3 D = lightD;
543                 float radius = data1.y;
544                 float invarea = data1.w;
545
546                 if(radius > 0.0f)
547                         D = distant_light_sample(D, radius, randu, randv);
548
549                 ls->P = D;
550                 ls->Ng = D;
551                 ls->D = -D;
552                 ls->t = FLT_MAX;
553
554                 float costheta = dot(lightD, D);
555                 ls->pdf = invarea/(costheta*costheta*costheta);
556                 ls->eval_fac = ls->pdf*kernel_data.integrator.inv_pdf_lights;
557         }
558 #ifdef __BACKGROUND_MIS__
559         else if(type == LIGHT_BACKGROUND) {
560                 /* infinite area light (e.g. light dome or env light) */
561                 float3 D = -background_light_sample(kg, P, randu, randv, &ls->pdf);
562
563                 ls->P = D;
564                 ls->Ng = D;
565                 ls->D = -D;
566                 ls->t = FLT_MAX;
567                 ls->eval_fac = 1.0f;
568                 ls->pdf *= kernel_data.integrator.pdf_lights;
569         }
570 #endif
571         else {
572                 ls->P = make_float3(data0.y, data0.z, data0.w);
573
574                 if(type == LIGHT_POINT || type == LIGHT_SPOT) {
575                         float radius = data1.y;
576
577                         if(radius > 0.0f)
578                                 /* sphere light */
579                                 ls->P += sphere_light_sample(P, ls->P, radius, randu, randv);
580
581                         ls->D = normalize_len(ls->P - P, &ls->t);
582                         ls->Ng = -ls->D;
583
584                         float invarea = data1.z;
585                         ls->eval_fac = (0.25f*M_1_PI_F)*invarea;
586                         ls->pdf = invarea;
587
588                         if(type == LIGHT_SPOT) {
589                                 /* spot light attenuation */
590                                 float4 data2 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 2);
591                                 ls->eval_fac *= spot_light_attenuation(data1, data2, ls);
592                         }
593                         ls->pdf *= lamp_light_pdf(kg, ls->Ng, -ls->D, ls->t);
594                 }
595                 else {
596                         /* area light */
597                         float4 data2 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 2);
598                         float4 data3 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 3);
599
600                         float3 axisu = make_float3(data1.y, data1.z, data1.w);
601                         float3 axisv = make_float3(data2.y, data2.z, data2.w);
602                         float3 D = make_float3(data3.y, data3.z, data3.w);
603
604                         ls->pdf = area_light_sample(P, &ls->P,
605                                                   axisu, axisv,
606                                                   randu, randv,
607                                                   true);
608
609                         ls->Ng = D;
610                         ls->D = normalize_len(ls->P - P, &ls->t);
611
612                         float invarea = data2.x;
613                         ls->eval_fac = 0.25f*invarea;
614
615                         if(dot(ls->D, D) > 0.0f)
616                                 ls->pdf = 0.0f;
617                 }
618
619                 ls->eval_fac *= kernel_data.integrator.inv_pdf_lights;
620         }
621 }
622
623 #if defined(__KERNEL_CUDA__) && (defined(i386) || defined(_M_IX86))
624 ccl_device_noinline
625 #else
626 ccl_device
627 #endif
628 bool lamp_light_eval(KernelGlobals *kg, int lamp, float3 P, float3 D, float t, LightSample *ls)
629 {
630         float4 data0 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 0);
631         float4 data1 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 1);
632
633         LightType type = (LightType)__float_as_int(data0.x);
634         ls->type = type;
635         ls->shader = __float_as_int(data1.x);
636         ls->object = PRIM_NONE;
637         ls->prim = PRIM_NONE;
638         ls->lamp = lamp;
639         /* todo: missing texture coordinates */
640         ls->u = 0.0f;
641         ls->v = 0.0f;
642
643         if(!(ls->shader & SHADER_USE_MIS))
644                 return false;
645
646         if(type == LIGHT_DISTANT) {
647                 /* distant light */
648                 float radius = data1.y;
649
650                 if(radius == 0.0f)
651                         return false;
652                 if(t != FLT_MAX)
653                         return false;
654
655                 /* a distant light is infinitely far away, but equivalent to a disk
656                  * shaped light exactly 1 unit away from the current shading point.
657                  *
658                  *     radius              t^2/cos(theta)
659                  *  <---------->           t = sqrt(1^2 + tan(theta)^2)
660                  *       tan(th)           area = radius*radius*pi
661                  *       <----->
662                  *        \    |           (1 + tan(theta)^2)/cos(theta)
663                  *         \   |           (1 + tan(acos(cos(theta)))^2)/cos(theta)
664                  *       t  \th| 1         simplifies to
665                  *           \-|           1/(cos(theta)^3)
666                  *            \|           magic!
667                  *             P
668                  */
669
670                 float3 lightD = make_float3(data0.y, data0.z, data0.w);
671                 float costheta = dot(-lightD, D);
672                 float cosangle = data1.z;
673
674                 if(costheta < cosangle)
675                         return false;
676
677                 ls->P = -D;
678                 ls->Ng = -D;
679                 ls->D = D;
680                 ls->t = FLT_MAX;
681
682                 /* compute pdf */
683                 float invarea = data1.w;
684                 ls->pdf = invarea/(costheta*costheta*costheta);
685                 ls->eval_fac = ls->pdf;
686         }
687         else if(type == LIGHT_POINT || type == LIGHT_SPOT) {
688                 float3 lightP = make_float3(data0.y, data0.z, data0.w);
689                 float radius = data1.y;
690
691                 /* sphere light */
692                 if(radius == 0.0f)
693                         return false;
694
695                 if(!ray_aligned_disk_intersect(P, D, t,
696                         lightP, radius, &ls->P, &ls->t))
697                         return false;
698
699                 ls->Ng = -D;
700                 ls->D = D;
701
702                 float invarea = data1.z;
703                 ls->eval_fac = (0.25f*M_1_PI_F)*invarea;
704                 ls->pdf = invarea;
705
706                 if(type == LIGHT_SPOT) {
707                         /* spot light attenuation */
708                         float4 data2 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 2);
709                         ls->eval_fac *= spot_light_attenuation(data1, data2, ls);
710
711                         if(ls->eval_fac == 0.0f)
712                                 return false;
713                 }
714
715                 /* compute pdf */
716                 if(ls->t != FLT_MAX)
717                         ls->pdf *= lamp_light_pdf(kg, ls->Ng, -ls->D, ls->t);
718         }
719         else if(type == LIGHT_AREA) {
720                 /* area light */
721                 float4 data2 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 2);
722                 float4 data3 = kernel_tex_fetch(__light_data, lamp*LIGHT_SIZE + 3);
723
724                 float invarea = data2.x;
725                 if(invarea == 0.0f)
726                         return false;
727
728                 float3 axisu = make_float3(data1.y, data1.z, data1.w);
729                 float3 axisv = make_float3(data2.y, data2.z, data2.w);
730                 float3 Ng = make_float3(data3.y, data3.z, data3.w);
731
732                 /* one sided */
733                 if(dot(D, Ng) >= 0.0f)
734                         return false;
735
736                 float3 light_P = make_float3(data0.y, data0.z, data0.w);
737
738                 if(!ray_quad_intersect(P, D, t,
739                         light_P, axisu, axisv, &ls->P, &ls->t))
740                         return false;
741
742                 ls->D = D;
743                 ls->Ng = Ng;
744                 ls->pdf = area_light_sample(P, &light_P, axisu, axisv, 0, 0, false);
745                 ls->eval_fac = 0.25f*invarea;
746         }
747         else
748                 return false;
749
750         return true;
751 }
752
753 /* Triangle Light */
754
755 ccl_device void object_transform_light_sample(KernelGlobals *kg, LightSample *ls, int object, float time)
756 {
757 #ifdef __INSTANCING__
758         /* instance transform */
759         if(object >= 0) {
760 #ifdef __OBJECT_MOTION__
761                 Transform itfm;
762                 Transform tfm = object_fetch_transform_motion_test(kg, object, time, &itfm);
763 #else
764                 Transform tfm = object_fetch_transform(kg, object, OBJECT_TRANSFORM);
765 #endif
766
767                 ls->P = transform_point(&tfm, ls->P);
768                 ls->Ng = normalize(transform_direction(&tfm, ls->Ng));
769         }
770 #endif
771 }
772
773 ccl_device void triangle_light_sample(KernelGlobals *kg, int prim, int object,
774         float randu, float randv, float time, LightSample *ls)
775 {
776         float u, v;
777
778         /* compute random point in triangle */
779         randu = sqrtf(randu);
780
781         u = 1.0f - randu;
782         v = randv*randu;
783
784         /* triangle, so get position, normal, shader */
785         triangle_point_normal(kg, object, prim, u, v, &ls->P, &ls->Ng, &ls->shader);
786         ls->object = object;
787         ls->prim = prim;
788         ls->lamp = LAMP_NONE;
789         ls->shader |= SHADER_USE_MIS;
790         ls->t = 0.0f;
791         ls->u = u;
792         ls->v = v;
793         ls->type = LIGHT_TRIANGLE;
794         ls->eval_fac = 1.0f;
795
796         object_transform_light_sample(kg, ls, object, time);
797 }
798
799 ccl_device float triangle_light_pdf(KernelGlobals *kg,
800         const float3 Ng, const float3 I, float t)
801 {
802         float pdf = kernel_data.integrator.pdf_triangles;
803         float cos_pi = fabsf(dot(Ng, I));
804
805         if(cos_pi == 0.0f)
806                 return 0.0f;
807         
808         return t*t*pdf/cos_pi;
809 }
810
811 /* Light Distribution */
812
813 ccl_device int light_distribution_sample(KernelGlobals *kg, float randt)
814 {
815         /* this is basically std::upper_bound as used by pbrt, to find a point light or
816          * triangle to emit from, proportional to area. a good improvement would be to
817          * also sample proportional to power, though it's not so well defined with
818          * OSL shaders. */
819         int first = 0;
820         int len = kernel_data.integrator.num_distribution + 1;
821
822         while(len > 0) {
823                 int half_len = len >> 1;
824                 int middle = first + half_len;
825
826                 if(randt < kernel_tex_fetch(__light_distribution, middle).x) {
827                         len = half_len;
828                 }
829                 else {
830                         first = middle + 1;
831                         len = len - half_len - 1;
832                 }
833         }
834
835         /* clamping should not be needed but float rounding errors seem to
836          * make this fail on rare occasions */
837         return clamp(first-1, 0, kernel_data.integrator.num_distribution-1);
838 }
839
840 /* Generic Light */
841
842 ccl_device bool light_select_reached_max_bounces(KernelGlobals *kg, int index, int bounce)
843 {
844         float4 data4 = kernel_tex_fetch(__light_data, index*LIGHT_SIZE + 4);
845         return (bounce > __float_as_int(data4.x));
846 }
847
848 ccl_device void light_sample(KernelGlobals *kg, float randt, float randu, float randv, float time, float3 P, int bounce, LightSample *ls)
849 {
850         /* sample index */
851         int index = light_distribution_sample(kg, randt);
852
853         /* fetch light data */
854         float4 l = kernel_tex_fetch(__light_distribution, index);
855         int prim = __float_as_int(l.y);
856
857         if(prim >= 0) {
858                 int object = __float_as_int(l.w);
859                 int shader_flag = __float_as_int(l.z);
860
861                 triangle_light_sample(kg, prim, object, randu, randv, time, ls);
862
863                 /* compute incoming direction, distance and pdf */
864                 ls->D = normalize_len(ls->P - P, &ls->t);
865                 ls->pdf = triangle_light_pdf(kg, ls->Ng, -ls->D, ls->t);
866                 ls->shader |= shader_flag;
867         }
868         else {
869                 int lamp = -prim-1;
870
871                 if(UNLIKELY(light_select_reached_max_bounces(kg, lamp, bounce))) {
872                         ls->pdf = 0.0f;
873                         return;
874                 }
875
876                 lamp_light_sample(kg, lamp, randu, randv, P, ls);
877         }
878 }
879
880 ccl_device int light_select_num_samples(KernelGlobals *kg, int index)
881 {
882         float4 data3 = kernel_tex_fetch(__light_data, index*LIGHT_SIZE + 3);
883         return __float_as_int(data3.x);
884 }
885
886 CCL_NAMESPACE_END
887