Cycles: merge of changes from tomato branch.
[blender-staging.git] / intern / cycles / kernel / kernel_compat_cpu.h
1 /*
2  * Copyright 2011, Blender Foundation.
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public License
6  * as published by the Free Software Foundation; either version 2
7  * of the License, or (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write to the Free Software Foundation,
16  * Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
17  */
18
19 #ifndef __KERNEL_COMPAT_CPU_H__
20 #define __KERNEL_COMPAT_CPU_H__
21
22 #define __KERNEL_CPU__
23
24 #include "util_debug.h"
25 #include "util_math.h"
26 #include "util_types.h"
27
28 CCL_NAMESPACE_BEGIN
29
30 /* Assertions inside the kernel only work for the CPU device, so we wrap it in
31  * a macro which is empty for other devices */
32
33 #define kernel_assert(cond) assert(cond)
34
35 /* Texture types to be compatible with CUDA textures. These are really just
36  * simple arrays and after inlining fetch hopefully revert to being a simple
37  * pointer lookup. */
38
39 template<typename T> struct texture  {
40         T fetch(int index)
41         {
42                 kernel_assert(index >= 0 && index < width);
43                 return data[index];
44         }
45
46 #if 0
47         __m128 fetch_m128(int index)
48         {
49                 kernel_assert(index >= 0 && index < width);
50                 return ((__m128*)data)[index];
51         }
52
53         __m128i fetch_m128i(int index)
54         {
55                 kernel_assert(index >= 0 && index < width);
56                 return ((__m128i*)data)[index];
57         }
58 #endif
59
60         float interp(float x, int size)
61         {
62                 kernel_assert(size == width);
63
64                 x = clamp(x, 0.0f, 1.0f)*width;
65
66                 int index = min((int)x, width-1);
67                 int nindex = min(index+1, width-1);
68                 float t = x - index;
69
70                 return (1.0f - t)*data[index] + t*data[nindex];
71         }
72
73         T *data;
74         int width;
75 };
76
77 template<typename T> struct texture_image  {
78         float4 read(float4 r)
79         {
80                 return r;
81         }
82
83         float4 read(uchar4 r)
84         {
85                 float f = 1.0f/255.0f;
86                 return make_float4(r.x*f, r.y*f, r.z*f, r.w*f);
87         }
88
89         int wrap_periodic(int x, int width)
90         {
91                 x %= width;
92                 if(x < 0)
93                         x += width;
94                 return x;
95         }
96
97         int wrap_clamp(int x, int width)
98         {
99                 return clamp(x, 0, width-1);
100         }
101
102         float frac(float x, int *ix)
103         {
104                 int i = (int)x - ((x < 0.0f)? 1: 0);
105                 *ix = i;
106                 return x - (float)i;
107         }
108
109         float4 interp(float x, float y, bool periodic = true)
110         {
111                 if(!data)
112                         return make_float4(0.0f, 0.0f, 0.0f, 0.0f);
113
114                 int ix, iy, nix, niy;
115                 float tx = frac(x*width, &ix);
116                 float ty = frac(y*height, &iy);
117
118                 if(periodic) {
119                         ix = wrap_periodic(ix, width);
120                         iy = wrap_periodic(iy, height);
121
122                         nix = wrap_periodic(ix+1, width);
123                         niy = wrap_periodic(iy+1, height);
124                 }
125                 else {
126                         ix = wrap_clamp(ix, width);
127                         iy = wrap_clamp(iy, height);
128
129                         nix = wrap_clamp(ix+1, width);
130                         niy = wrap_clamp(iy+1, height);
131                 }
132
133                 float4 r = (1.0f - ty)*(1.0f - tx)*read(data[ix + iy*width]);
134                 r += (1.0f - ty)*tx*read(data[nix + iy*width]);
135                 r += ty*(1.0f - tx)*read(data[ix + niy*width]);
136                 r += ty*tx*read(data[nix + niy*width]);
137
138                 return r;
139         }
140
141         T *data;
142         int width, height;
143 };
144
145 typedef texture<float4> texture_float4;
146 typedef texture<float2> texture_float2;
147 typedef texture<float> texture_float;
148 typedef texture<uint> texture_uint;
149 typedef texture<int> texture_int;
150 typedef texture<uint4> texture_uint4;
151 typedef texture<uchar4> texture_uchar4;
152 typedef texture_image<float4> texture_image_float4;
153 typedef texture_image<uchar4> texture_image_uchar4;
154
155 /* Macros to handle different memory storage on different devices */
156
157 #define kernel_tex_fetch(tex, index) (kg->tex.fetch(index))
158 #define kernel_tex_fetch_m128(tex, index) (kg->tex.fetch_m128(index))
159 #define kernel_tex_fetch_m128i(tex, index) (kg->tex.fetch_m128i(index))
160 #define kernel_tex_interp(tex, t, size) (kg->tex.interp(t, size))
161 #define kernel_tex_image_interp(tex, x, y) ((tex < MAX_FLOAT_IMAGES) ? kg->texture_float_images[tex].interp(x, y) : kg->texture_byte_images[tex - MAX_FLOAT_IMAGES].interp(x, y))
162
163 #define kernel_data (kg->__data)
164
165 CCL_NAMESPACE_END
166
167 #endif /* __KERNEL_COMPAT_CPU_H__ */
168