Cycles: change __device and similar qualifiers to ccl_device in kernel code.
[blender.git] / intern / cycles / kernel / kernel_compat_cuda.h
1 /*
2  * Copyright 2011-2013 Blender Foundation
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License
15  */
16
17 #ifndef __KERNEL_COMPAT_CUDA_H__
18 #define __KERNEL_COMPAT_CUDA_H__
19
20 #define __KERNEL_GPU__
21 #define __KERNEL_CUDA__
22 #define CCL_NAMESPACE_BEGIN
23 #define CCL_NAMESPACE_END
24
25 #include <cuda.h>
26 #include <float.h>
27
28 /* Qualifier wrappers for different names on different devices */
29
30 #define ccl_device  __device__ __inline__
31 #define ccl_device_inline  __device__ __inline__
32 #define ccl_device_noinline  __device__ __noinline__
33 #define ccl_global
34 #define ccl_constant
35 #define ccl_may_alias
36
37 /* No assert supported for CUDA */
38
39 #define kernel_assert(cond)
40
41 /* Types */
42
43 #include "util_types.h"
44
45 /* Textures */
46
47 typedef texture<float4, 1> texture_float4;
48 typedef texture<float2, 1> texture_float2;
49 typedef texture<float, 1> texture_float;
50 typedef texture<uint, 1> texture_uint;
51 typedef texture<int, 1> texture_int;
52 typedef texture<uint4, 1> texture_uint4;
53 typedef texture<uchar4, 1> texture_uchar4;
54 typedef texture<float4, 2> texture_image_float4;
55 typedef texture<uchar4, 2, cudaReadModeNormalizedFloat> texture_image_uchar4;
56
57 /* Macros to handle different memory storage on different devices */
58
59 /* In order to use full 6GB of memory on Titan cards, use arrays instead
60  * of textures. On earlier cards this seems slower, but on Titan it is
61  * actually slightly faster in tests. */
62 #if __CUDA_ARCH__ < 350
63 #define __KERNEL_CUDA_TEX_STORAGE__
64 #endif
65
66 #ifdef __KERNEL_CUDA_TEX_STORAGE__
67 #define kernel_tex_fetch(t, index) tex1Dfetch(t, index)
68 #else
69 #define kernel_tex_fetch(t, index) t[(index)]
70 #endif
71 #define kernel_tex_image_interp(t, x, y) tex2D(t, x, y)
72
73 #define kernel_data __data
74
75 /* Use fast math functions */
76
77 #define cosf(x) __cosf(((float)x))
78 #define sinf(x) __sinf(((float)x))
79 #define powf(x, y) __powf(((float)x), ((float)y))
80 #define tanf(x) __tanf(((float)x))
81 #define logf(x) __logf(((float)x))
82 #define expf(x) __expf(((float)x))
83
84 #endif /* __KERNEL_COMPAT_CUDA_H__ */
85