Cycles: constant folding for RGB/Vector Curves and Color Ramp.
[blender.git] / intern / cycles / kernel / svm / svm_ramp.h
1 /*
2  * Copyright 2011-2013 Blender Foundation
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 #ifndef __SVM_RAMP_H__
18 #define __SVM_RAMP_H__
19
20 CCL_NAMESPACE_BEGIN
21
22 /* NOTE: svm_ramp.h, svm_ramp_util.h and node_ramp_util.h must stay consistent */
23
24 ccl_device float4 rgb_ramp_lookup(KernelGlobals *kg,
25                                   int offset,
26                                   float f,
27                                   bool interpolate,
28                                   bool extrapolate,
29                                   int table_size)
30 {
31         if((f < 0.0f || f > 1.0f) && extrapolate) {
32                 float4 t0, dy;
33                 if(f < 0.0f) {
34                         t0 = fetch_node_float(kg, offset);
35                         dy = t0 - fetch_node_float(kg, offset + 1);
36                         f = -f;
37                 }
38                 else {
39                         t0 = fetch_node_float(kg, offset + table_size - 1);
40                         dy = t0 - fetch_node_float(kg, offset + table_size - 2);
41                         f = f - 1.0f;
42                 }
43                 return t0 + dy * f * (table_size-1);
44         }
45
46         f = saturate(f)*(table_size-1);
47
48         /* clamp int as well in case of NaN */
49         int i = clamp(float_to_int(f), 0, table_size-1);
50         float t = f - (float)i;
51
52         float4 a = fetch_node_float(kg, offset+i);
53
54         if(interpolate && t > 0.0f)
55                 a = (1.0f - t)*a + t*fetch_node_float(kg, offset+i+1);
56
57         return a;
58 }
59
60 ccl_device void svm_node_rgb_ramp(KernelGlobals *kg, ShaderData *sd, float *stack, uint4 node, int *offset)
61 {
62         uint fac_offset, color_offset, alpha_offset;
63         uint interpolate = node.z;
64
65         decode_node_uchar4(node.y, &fac_offset, &color_offset, &alpha_offset, NULL);
66
67         uint table_size = read_node(kg, offset).x;
68
69         float fac = stack_load_float(stack, fac_offset);
70         float4 color = rgb_ramp_lookup(kg, *offset, fac, interpolate, false, table_size);
71
72         if(stack_valid(color_offset))
73                 stack_store_float3(stack, color_offset, float4_to_float3(color));
74         if(stack_valid(alpha_offset))
75                 stack_store_float(stack, alpha_offset, color.w);
76
77         *offset += table_size;
78 }
79
80 ccl_device void svm_node_curves(KernelGlobals *kg, ShaderData *sd, float *stack, uint4 node, int *offset)
81 {
82         uint fac_offset, color_offset, out_offset;
83         decode_node_uchar4(node.y,
84                            &fac_offset,
85                            &color_offset,
86                            &out_offset,
87                            NULL);
88
89         uint table_size = read_node(kg, offset).x;
90
91         float fac = stack_load_float(stack, fac_offset);
92         float3 color = stack_load_float3(stack, color_offset);
93
94         const float min_x = __int_as_float(node.z),
95                     max_x = __int_as_float(node.w);
96         const float range_x = max_x - min_x;
97         const float3 relpos = (color - make_float3(min_x, min_x, min_x)) / range_x;
98
99         float r = rgb_ramp_lookup(kg, *offset, relpos.x, true, true, table_size).x;
100         float g = rgb_ramp_lookup(kg, *offset, relpos.y, true, true, table_size).y;
101         float b = rgb_ramp_lookup(kg, *offset, relpos.z, true, true, table_size).z;
102
103         color = (1.0f - fac)*color + fac*make_float3(r, g, b);
104         stack_store_float3(stack, out_offset, color);
105
106         *offset += table_size;
107 }
108
109 CCL_NAMESPACE_END
110
111 #endif /* __SVM_RAMP_H__ */
112