Cycles: amd opencl compatibility fixes.
[blender.git] / intern / cycles / kernel / svm / svm_math.h
1 /*
2  * Copyright 2011, Blender Foundation.
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public License
6  * as published by the Free Software Foundation; either version 2
7  * of the License, or (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software Foundation,
16  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
17  */
18
19 CCL_NAMESPACE_BEGIN
20
21 __device float safe_asinf(float a)
22 {
23         if(a <= -1.0f)
24                 return -M_PI_2_F;
25         else if(a >= 1.0f)
26                 return M_PI_2_F;
27
28         return asinf(a);
29 }
30
31 __device float safe_acosf(float a)
32 {
33         if(a <= -1.0f)
34                 return M_PI_F;
35         else if(a >= 1.0f)
36                 return 0.0f;
37
38         return acosf(a);
39 }
40
41 __device float safe_powf(float a, float b)
42 {
43         if(b == 0.0f)
44                 return 1.0f;
45         if(a == 0.0f)
46                 return 0.0f;
47         if(a < 0.0f && b != (int)b)
48                 return 0.0f;
49         
50         return powf(a, b);
51 }
52
53 __device float safe_logf(float a, float b)
54 {
55         if(a < 0.0f || b < 0.0f)
56                 return 0.0f;
57
58         return logf(a)/logf(b);
59 }
60
61 __device float safe_divide(float a, float b)
62 {
63         float result;
64
65         if(b == 0.0f)
66                 result = 0.0f;
67         else
68                 result = a/b;
69         
70         return result;
71 }
72
73 __device float svm_math(NodeMath type, float Fac1, float Fac2)
74 {
75         float Fac;
76
77         if(type == NODE_MATH_ADD)
78                 Fac = Fac1 + Fac2;
79         else if(type == NODE_MATH_SUBTRACT)
80                 Fac = Fac1 - Fac2;
81         else if(type == NODE_MATH_MULTIPLY)
82                 Fac = Fac1*Fac2;
83         else if(type == NODE_MATH_DIVIDE)
84                 Fac = safe_divide(Fac1, Fac2);
85         else if(type == NODE_MATH_SINE)
86                 Fac = sinf(Fac1);
87         else if(type == NODE_MATH_COSINE)
88                 Fac = cosf(Fac1);
89         else if(type == NODE_MATH_TANGENT)
90                 Fac = tanf(Fac1);
91         else if(type == NODE_MATH_ARCSINE)
92                 Fac = safe_asinf(Fac1);
93         else if(type == NODE_MATH_ARCCOSINE)
94                 Fac = safe_acosf(Fac1);
95         else if(type == NODE_MATH_ARCTANGENT)
96                 Fac = atanf(Fac1);
97         else if(type == NODE_MATH_POWER)
98                 Fac = safe_powf(Fac1, Fac2);
99         else if(type == NODE_MATH_LOGARITHM)
100                 Fac = safe_logf(Fac1, Fac2);
101         else if(type == NODE_MATH_MINIMUM)
102                 Fac = fminf(Fac1, Fac2);
103         else if(type == NODE_MATH_MAXIMUM)
104                 Fac = fmaxf(Fac1, Fac2);
105         else if(type == NODE_MATH_ROUND)
106                 Fac = floorf(Fac1 + 0.5f);
107         else if(type == NODE_MATH_LESS_THAN)
108                 Fac = Fac1 < Fac2;
109         else if(type == NODE_MATH_GREATER_THAN)
110                 Fac = Fac1 > Fac2;
111         else
112                 Fac = 0.0f;
113         
114         return Fac;
115 }
116
117 __device float average_fac(float3 v)
118 {
119         return (fabsf(v.x) + fabsf(v.y) + fabsf(v.z))/3.0f;
120 }
121
122 __device void svm_vector_math(float *Fac, float3 *Vector, NodeVectorMath type, float3 Vector1, float3 Vector2)
123 {
124         if(type == NODE_VECTOR_MATH_ADD) {
125                 *Vector = Vector1 + Vector2;
126                 *Fac = average_fac(*Vector);
127         }
128         else if(type == NODE_VECTOR_MATH_SUBTRACT) {
129                 *Vector = Vector1 - Vector2;
130                 *Fac = average_fac(*Vector);
131         }
132         else if(type == NODE_VECTOR_MATH_AVERAGE) {
133                 *Fac = len(Vector1 + Vector2);
134                 *Vector = normalize(Vector1 + Vector2);
135         }
136         else if(type == NODE_VECTOR_MATH_DOT_PRODUCT) {
137                 *Fac = dot(Vector1, Vector2);
138                 *Vector = make_float3(0.0f, 0.0f, 0.0f);
139         }
140         else if(type == NODE_VECTOR_MATH_CROSS_PRODUCT) {
141                 float3 c = cross(Vector1, Vector2);
142                 *Fac = len(c);
143                 *Vector = normalize(c);
144         }
145         else if(type == NODE_VECTOR_MATH_NORMALIZE) {
146                 *Fac = len(Vector1);
147                 *Vector = normalize(Vector1);
148         }
149         else {
150                 *Fac = 0.0f;
151                 *Vector = make_float3(0.0f, 0.0f, 0.0f);
152         }
153 }
154
155 /* Nodes */
156
157 __device void svm_node_math(KernelGlobals *kg, ShaderData *sd, float *stack, uint itype, uint f1_offset, uint f2_offset, int *offset)
158 {
159         NodeMath type = (NodeMath)itype;
160         float f1 = stack_load_float(stack, f1_offset);
161         float f2 = stack_load_float(stack, f2_offset);
162         float f = svm_math(type, f1, f2);
163
164         uint4 node1 = read_node(kg, offset);
165
166         stack_store_float(stack, node1.y, f);
167 }
168
169 __device void svm_node_vector_math(KernelGlobals *kg, ShaderData *sd, float *stack, uint itype, uint v1_offset, uint v2_offset, int *offset)
170 {
171         NodeVectorMath type = (NodeVectorMath)itype;
172         float3 v1 = stack_load_float3(stack, v1_offset);
173         float3 v2 = stack_load_float3(stack, v2_offset);
174         float f;
175         float3 v;
176
177         svm_vector_math(&f, &v, type, v1, v2);
178
179         uint4 node1 = read_node(kg, offset);
180
181         if(stack_valid(node1.y)) stack_store_float(stack, node1.y, f);
182         if(stack_valid(node1.z)) stack_store_float3(stack, node1.z, v);
183 }
184
185 CCL_NAMESPACE_END
186