Cycles: Tweaks to support CUDA 8 toolkit
[blender-staging.git] / intern / cycles / kernel / geom / geom_volume.h
1 /*
2  * Copyright 2011-2013 Blender Foundation
3  *
4  * Licensed under the Apache License, Version 2.0 (the "License");
5  * you may not use this file except in compliance with the License.
6  * You may obtain a copy of the License at
7  *
8  * http://www.apache.org/licenses/LICENSE-2.0
9  *
10  * Unless required by applicable law or agreed to in writing, software
11  * distributed under the License is distributed on an "AS IS" BASIS,
12  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13  * See the License for the specific language governing permissions and
14  * limitations under the License.
15  */
16
17 /* Volume Primitive
18  *
19  * Volumes are just regions inside meshes with the mesh surface as boundaries.
20  * There isn't as much data to access as for surfaces, there is only a position
21  * to do lookups in 3D voxel or procedural textures.
22  *
23  * 3D voxel textures can be assigned as attributes per mesh, which means the
24  * same shader can be used for volume objects with different densities, etc. */
25
26 CCL_NAMESPACE_BEGIN
27
28 #ifdef __VOLUME__
29
30 /* Return position normalized to 0..1 in mesh bounds */
31
32 #if defined(__KERNEL_GPU__) && __CUDA_ARCH__ < 300
33 ccl_device float4 volume_image_texture_3d(int id, float x, float y, float z)
34 {
35         float4 r;
36         switch(id) {
37                 case 0: r = kernel_tex_image_interp_3d(__tex_image_float4_3d_000, x, y, z); break;
38                 case 1: r = kernel_tex_image_interp_3d(__tex_image_float4_3d_001, x, y, z); break;
39                 case 2: r = kernel_tex_image_interp_3d(__tex_image_float4_3d_002, x, y, z); break;
40                 case 3: r = kernel_tex_image_interp_3d(__tex_image_float4_3d_003, x, y, z); break;
41                 case 4: r = kernel_tex_image_interp_3d(__tex_image_float4_3d_004, x, y, z); break;
42         }
43         return r;
44 }
45 #endif  /* __KERNEL_GPU__ */
46
47 ccl_device_inline float3 volume_normalized_position(KernelGlobals *kg,
48                                                     const ShaderData *sd,
49                                                     float3 P)
50 {
51         /* todo: optimize this so it's just a single matrix multiplication when
52          * possible (not motion blur), or perhaps even just translation + scale */
53         AttributeElement attr_elem;
54         int attr_offset = find_attribute(kg, sd, ATTR_STD_GENERATED_TRANSFORM, &attr_elem);
55
56         object_inverse_position_transform(kg, sd, &P);
57
58         if(attr_offset != ATTR_STD_NOT_FOUND) {
59                 Transform tfm = primitive_attribute_matrix(kg, sd, attr_offset);
60                 P = transform_point(&tfm, P);
61         }
62
63         return P;
64 }
65
66 ccl_device float volume_attribute_float(KernelGlobals *kg, const ShaderData *sd, AttributeElement elem, int id, float *dx, float *dy)
67 {
68         float3 P = volume_normalized_position(kg, sd, sd->P);
69 #ifdef __KERNEL_GPU__
70 #  if __CUDA_ARCH__ >= 300
71         CUtexObject tex = kernel_tex_fetch(__bindless_mapping, id);
72         float f = kernel_tex_image_interp_3d_float(tex, P.x, P.y, P.z);
73         float4 r = make_float4(f, f, f, 1.0);
74 #  else
75         float4 r = volume_image_texture_3d(id, P.x, P.y, P.z);
76 #  endif
77 #else
78         float4 r;
79         if(sd->flag & SD_VOLUME_CUBIC)
80                 r = kernel_tex_image_interp_3d_ex(id, P.x, P.y, P.z, INTERPOLATION_CUBIC);
81         else
82                 r = kernel_tex_image_interp_3d(id, P.x, P.y, P.z);
83 #endif
84
85         if(dx) *dx = 0.0f;
86         if(dy) *dy = 0.0f;
87
88         return average(float4_to_float3(r));
89 }
90
91 ccl_device float3 volume_attribute_float3(KernelGlobals *kg, const ShaderData *sd, AttributeElement elem, int id, float3 *dx, float3 *dy)
92 {
93         float3 P = volume_normalized_position(kg, sd, sd->P);
94 #ifdef __KERNEL_GPU__
95 #  if __CUDA_ARCH__ >= 300
96         CUtexObject tex = kernel_tex_fetch(__bindless_mapping, id);
97         float4 r = kernel_tex_image_interp_3d_float4(tex, P.x, P.y, P.z);
98 #  else
99         float4 r = volume_image_texture_3d(id, P.x, P.y, P.z);
100 #  endif
101 #else
102         float4 r;
103         if(sd->flag & SD_VOLUME_CUBIC)
104                 r = kernel_tex_image_interp_3d_ex(id, P.x, P.y, P.z, INTERPOLATION_CUBIC);
105         else
106                 r = kernel_tex_image_interp_3d(id, P.x, P.y, P.z);
107 #endif
108
109         if(dx) *dx = make_float3(0.0f, 0.0f, 0.0f);
110         if(dy) *dy = make_float3(0.0f, 0.0f, 0.0f);
111
112         return float4_to_float3(r);
113 }
114
115 #endif
116
117 CCL_NAMESPACE_END
118