Merge branch 'master' into blender2.8
[blender.git] / source / blender / blenkernel / intern / ocean.c
index e76cde652c861df11032d0142c3cd776f25ef52a..2d8527f23d66ff7203810750d85651bf4e1cadbf 100644 (file)
@@ -25,6 +25,9 @@
  * ***** END GPL LICENSE BLOCK *****
  */
 
+/** \file blender/blenkernel/intern/ocean.c
+ *  \ingroup bke
+ */
 
 #include <math.h>
 #include <stdlib.h>
 
 #include "DNA_scene_types.h"
 
-#include "BKE_image.h"
-#include "BKE_ocean.h"
-#include "BKE_utildefines.h"
-
-#include "BKE_global.h" // XXX TESTING
-
-#include "BLI_math_base.h"
-#include "BLI_math_inline.h"
+#include "BLI_math.h"
+#include "BLI_path_util.h"
 #include "BLI_rand.h"
-#include "BLI_string.h"
+#include "BLI_task.h"
 #include "BLI_threads.h"
-#include "BLI_path_util.h"
 #include "BLI_utildefines.h"
 
+#include "BKE_image.h"
+#include "BKE_ocean.h"
+
 #include "IMB_imbuf.h"
 #include "IMB_imbuf_types.h"
 
@@ -56,7 +55,7 @@
 
 #ifdef WITH_OCEANSIM
 
-// Ocean code
+/* Ocean code */
 #include "fftw3.h"
 
 #define GRAVITY  9.81f
@@ -84,7 +83,7 @@ typedef struct Ocean {
        float _Lx;
        float _Lz;
 
-       float normalize_factor;                 // init w
+       float normalize_factor;                 /* init w */
        float time;
 
        short _do_disp_y;
@@ -98,69 +97,73 @@ typedef struct Ocean {
        /* ********* sim data arrays ********* */
 
        /* two dimensional arrays of complex */
-       fftw_complex *_fft_in;          // init w       sim w
-       fftw_complex *_fft_in_x;        // init w       sim w
-       fftw_complex *_fft_in_z;        // init w       sim w
-       fftw_complex *_fft_in_jxx;      // init w       sim w
-       fftw_complex *_fft_in_jzz;      // init w       sim w
-       fftw_complex *_fft_in_jxz;      // init w       sim w
-       fftw_complex *_fft_in_nx;       // init w       sim w
-       fftw_complex *_fft_in_nz;       // init w       sim w
-       fftw_complex *_htilda;          // init w       sim w (only once)
+       fftw_complex *_fft_in;          /* init w       sim w */
+       fftw_complex *_fft_in_x;        /* init w       sim w */
+       fftw_complex *_fft_in_z;        /* init w       sim w */
+       fftw_complex *_fft_in_jxx;      /* init w       sim w */
+       fftw_complex *_fft_in_jzz;      /* init w       sim w */
+       fftw_complex *_fft_in_jxz;      /* init w       sim w */
+       fftw_complex *_fft_in_nx;       /* init w       sim w */
+       fftw_complex *_fft_in_nz;       /* init w       sim w */
+       fftw_complex *_htilda;          /* init w       sim w (only once) */
 
        /* fftw "plans" */
-       fftw_plan _disp_y_plan;         // init w       sim r
-       fftw_plan _disp_x_plan;         // init w       sim r
-       fftw_plan _disp_z_plan;         // init w       sim r
-       fftw_plan _N_x_plan;            // init w       sim r
-       fftw_plan _N_z_plan;            // init w       sim r
-       fftw_plan _Jxx_plan;            // init w       sim r
-       fftw_plan _Jxz_plan;            // init w       sim r
-       fftw_plan _Jzz_plan;            // init w       sim r
+       fftw_plan _disp_y_plan;         /* init w       sim r */
+       fftw_plan _disp_x_plan;         /* init w       sim r */
+       fftw_plan _disp_z_plan;         /* init w       sim r */
+       fftw_plan _N_x_plan;            /* init w       sim r */
+       fftw_plan _N_z_plan;            /* init w       sim r */
+       fftw_plan _Jxx_plan;            /* init w       sim r */
+       fftw_plan _Jxz_plan;            /* init w       sim r */
+       fftw_plan _Jzz_plan;            /* init w       sim r */
 
        /* two dimensional arrays of float */
-       double *_disp_y;                // init w       sim w via plan?
-       double *_N_x;                   // init w       sim w via plan?
-       /*float * _N_y; all member of this array has same values, so convert this array to a float to reduce memory usage (MEM01)*/
-       double _N_y;                    //                      sim w ********* can be rearranged?
-       double *_N_z;                   // init w       sim w via plan?
-       double *_disp_x;                // init w       sim w via plan?
-       double *_disp_z;                // init w       sim w via plan?
+       double *_disp_y;                /* init w       sim w via plan? */
+       double *_N_x;                   /* init w       sim w via plan? */
+       /* all member of this array has same values, so convert this array to a float to reduce memory usage (MEM01)*/
+       /*float * _N_y; */
+       double _N_y;                    /*                      sim w ********* can be rearranged? */
+       double *_N_z;                   /* init w       sim w via plan? */
+       double *_disp_x;                /* init w       sim w via plan? */
+       double *_disp_z;                /* init w       sim w via plan? */
 
        /* two dimensional arrays of float */
        /* Jacobian and minimum eigenvalue */
-       double *_Jxx;                   // init w       sim w
-       double *_Jzz;                   // init w       sim w
-       double *_Jxz;                   // init w       sim w
+       double *_Jxx;                   /* init w       sim w */
+       double *_Jzz;                   /* init w       sim w */
+       double *_Jxz;                   /* init w       sim w */
 
        /* one dimensional float array */
-       float *_kx;                     // init w       sim r
-       float *_kz;                     // init w       sim r
+       float *_kx;                     /* init w       sim r */
+       float *_kz;                     /* init w       sim r */
 
        /* two dimensional complex array */
-       fftw_complex *_h0;              // init w       sim r
-       fftw_complex *_h0_minus;        // init w       sim r
+       fftw_complex *_h0;              /* init w       sim r */
+       fftw_complex *_h0_minus;        /* init w       sim r */
 
        /* two dimensional float array */
-       float *_k;                      // init w       sim r
+       float *_k;                      /* init w       sim r */
 } Ocean;
 
 
 
-static float nextfr(float min, float max)
+static float nextfr(RNG *rng, float min, float max)
 {
-       return BLI_frand() * (min - max) + max;
+       return BLI_rng_get_float(rng) * (min - max) + max;
 }
 
-static float gaussRand(void)
+static float gaussRand(RNG *rng)
 {
-       float x;        // Note: to avoid numerical problems with very small
-       float y;        // numbers, we make these variables singe-precision
-       float length2;  // floats, but later we call the double-precision log()
-       // and sqrt() functions instead of logf() and sqrtf().
+       /* Note: to avoid numerical problems with very small numbers, we make these variables singe-precision floats,
+        * but later we call the double-precision log() and sqrt() functions instead of logf() and sqrtf().
+        */ 
+       float x;
+       float y;
+       float length2;
+
        do {
-               x = (float) (nextfr(-1, 1));
-               y = (float)(nextfr(-1, 1));
+               x = (float) (nextfr(rng, -1, 1));
+               y = (float)(nextfr(rng, -1, 1));
                length2 = x * x + y * y;
        } while (length2 >= 1 || length2 == 0);
 
@@ -169,12 +172,7 @@ static float gaussRand(void)
 
 /**
  * Some useful functions
- * */
-MINLINE float lerp(float a, float b, float f)
-{
-       return a + (b - a) * f;
-}
-
+ */
 MINLINE float catrom(float p0, float p1, float p2, float p3, float f)
 {
        return 0.5f * ((2.0f * p1) +
@@ -185,26 +183,27 @@ MINLINE float catrom(float p0, float p1, float p2, float p3, float f)
 
 MINLINE float omega(float k, float depth)
 {
-       return sqrt(GRAVITY * k * tanh(k * depth));
+       return sqrtf(GRAVITY * k * tanhf(k * depth));
 }
 
-// modified Phillips spectrum
+/* modified Phillips spectrum */
 static float Ph(struct Ocean *o, float kx, float kz)
 {
        float tmp;
        float k2 = kx * kx + kz * kz;
 
        if (k2 == 0.0f) {
-               return 0.0f; // no DC component
+               return 0.0f; /* no DC component */
        }
 
-       // damp out the waves going in the direction opposite the wind
-       tmp = (o->_wx * kx  + o->_wz * kz) / sqrtf(k2);
+       /* damp out the waves going in the direction opposite the wind */
+       tmp = (o->_wx * kx + o->_wz * kz) / sqrtf(k2);
        if (tmp < 0) {
                tmp *= o->_damp_reflections;
        }
 
-       return o->_A * expf(-1.0f / (k2 * (o->_L * o->_L))) * expf(-k2 * (o->_l * o->_l)) * powf(fabsf(tmp), o->_wind_alignment) / (k2 * k2);
+       return o->_A * expf(-1.0f / (k2 * (o->_L * o->_L))) * expf(-k2 * (o->_l * o->_l)) *
+              powf(fabsf(tmp), o->_wind_alignment) / (k2 * k2);
 }
 
 static void compute_eigenstuff(struct OceanResult *ocr, float jxx, float jzz, float jxz)
@@ -242,7 +241,7 @@ static void init_complex(fftw_complex cmpl, float real, float image)
        cmpl[1] = image;
 }
 
-#if 0   // unused
+#if 0   /* unused */
 static void add_complex_f(fftw_complex res, fftw_complex cmpl, float f)
 {
        res[0] = cmpl[0] + f;
@@ -258,8 +257,8 @@ static void add_comlex_c(fftw_complex res, fftw_complex cmpl1, fftw_complex cmpl
 
 static void mul_complex_f(fftw_complex res, fftw_complex cmpl, float f)
 {
-       res[0] = cmpl[0] * f;
-       res[1] = cmpl[1] * f;
+       res[0] = cmpl[0] * (double)f;
+       res[1] = cmpl[1] * (double)f;
 }
 
 static void mul_complex_c(fftw_complex res, fftw_complex cmpl1, fftw_complex cmpl2)
@@ -291,8 +290,8 @@ static void exp_complex(fftw_complex res, fftw_complex cmpl)
 {
        float r = expf(cmpl[0]);
 
-       res[0] = cos(cmpl[1]) * r;
-       res[1] = sin(cmpl[1]) * r;
+       res[0] = cosf(cmpl[1]) * r;
+       res[1] = sinf(cmpl[1]) * r;
 }
 
 float BKE_ocean_jminus_to_foam(float jminus, float coverage)
@@ -308,7 +307,7 @@ void BKE_ocean_eval_uv(struct Ocean *oc, struct OceanResult *ocr, float u, float
        float frac_x, frac_z;
        float uu, vv;
 
-       // first wrap the texture so 0 <= (u, v) < 1
+       /* first wrap the texture so 0 <= (u, v) < 1 */
        u = fmodf(u, 1.0f);
        v = fmodf(v, 1.0f);
 
@@ -335,8 +334,10 @@ void BKE_ocean_eval_uv(struct Ocean *oc, struct OceanResult *ocr, float u, float
        i1 = i1 % oc->_M;
        j1 = j1 % oc->_N;
 
+#define BILERP(m) (interpf(interpf(m[i1 * oc->_N + j1], m[i0 * oc->_N + j1], frac_x), \
+                           interpf(m[i1 * oc->_N + j0], m[i0 * oc->_N + j0], frac_x), \
+                           frac_z))
 
-#define BILERP(m) (lerp(lerp(m[i0 * oc->_N + j0], m[i1 * oc->_N + j0], frac_x), lerp(m[i0 * oc->_N + j1], m[i1 * oc->_N + j1], frac_x), frac_z))
        {
                if (oc->_do_disp_y) {
                        ocr->disp[1] = BILERP(oc->_disp_y);
@@ -366,14 +367,14 @@ void BKE_ocean_eval_uv(struct Ocean *oc, struct OceanResult *ocr, float u, float
        BLI_rw_mutex_unlock(&oc->oceanmutex);
 }
 
-// use catmullrom interpolation rather than linear
+/* use catmullrom interpolation rather than linear */
 void BKE_ocean_eval_uv_catrom(struct Ocean *oc, struct OceanResult *ocr, float u, float v)
 {
        int i0, i1, i2, i3, j0, j1, j2, j3;
        float frac_x, frac_z;
        float uu, vv;
 
-       // first wrap the texture so 0 <= (u, v) < 1
+       /* first wrap the texture so 0 <= (u, v) < 1 */
        u = fmod(u, 1.0f);
        v = fmod(v, 1.0f);
 
@@ -410,11 +411,15 @@ void BKE_ocean_eval_uv_catrom(struct Ocean *oc, struct OceanResult *ocr, float u
        j0 = j0 <   0 ? j0 + oc->_N : j0;
        j3 = j3 >= oc->_N ? j3 - oc->_N : j3;
 
-#define INTERP(m) catrom(catrom(m[i0 * oc->_N + j0], m[i1 * oc->_N + j0], m[i2 * oc->_N + j0], m[i3 * oc->_N + j0], frac_x), \
-                            catrom(m[i0 * oc->_N + j1], m[i1 * oc->_N + j1], m[i2 * oc->_N + j1], m[i3 * oc->_N + j1], frac_x), \
-                            catrom(m[i0 * oc->_N + j2], m[i1 * oc->_N + j2], m[i2 * oc->_N + j2], m[i3 * oc->_N + j2], frac_x), \
-                            catrom(m[i0 * oc->_N + j3], m[i1 * oc->_N + j3], m[i2 * oc->_N + j3], m[i3 * oc->_N + j3], frac_x), \
-                            frac_z)
+#define INTERP(m) catrom(catrom(m[i0 * oc->_N + j0], m[i1 * oc->_N + j0], \
+                                m[i2 * oc->_N + j0], m[i3 * oc->_N + j0], frac_x), \
+                         catrom(m[i0 * oc->_N + j1], m[i1 * oc->_N + j1], \
+                                m[i2 * oc->_N + j1], m[i3 * oc->_N + j1], frac_x), \
+                         catrom(m[i0 * oc->_N + j2], m[i1 * oc->_N + j2], \
+                                m[i2 * oc->_N + j2], m[i3 * oc->_N + j2], frac_x), \
+                         catrom(m[i0 * oc->_N + j3], m[i1 * oc->_N + j3], \
+                                m[i2 * oc->_N + j3], m[i3 * oc->_N + j3], frac_x), \
+                         frac_z)
 
        {
                if (oc->_do_disp_y) {
@@ -454,9 +459,9 @@ void BKE_ocean_eval_xz_catrom(struct Ocean *oc, struct OceanResult *ocr, float x
        BKE_ocean_eval_uv_catrom(oc, ocr, x / oc->_Lx, z / oc->_Lz);
 }
 
-// note that this doesn't wrap properly for i, j < 0, but its
-// not really meant for that being just a way to get the raw data out
-// to save in some image format.
+/* note that this doesn't wrap properly for i, j < 0, but its not really meant for that being just a way to get
+ * the raw data out to save in some image format.
+ */
 void BKE_ocean_eval_ij(struct Ocean *oc, struct OceanResult *ocr, int i, int j)
 {
        BLI_rw_mutex_lock(&oc->oceanmutex, THREAD_LOCK_READ);
@@ -464,7 +469,7 @@ void BKE_ocean_eval_ij(struct Ocean *oc, struct OceanResult *ocr, int i, int j)
        i = abs(i) % oc->_M;
        j = abs(j) % oc->_N;
 
-       ocr->disp[1] = oc->_do_disp_y ? oc->_disp_y[i * oc->_N + j] : 0.0f;
+       ocr->disp[1] = oc->_do_disp_y ? (float)oc->_disp_y[i * oc->_N + j] : 0.0f;
 
        if (oc->_do_chop) {
                ocr->disp[0] = oc->_disp_x[i * oc->_N + j];
@@ -477,7 +482,7 @@ void BKE_ocean_eval_ij(struct Ocean *oc, struct OceanResult *ocr, int i, int j)
 
        if (oc->_do_normals) {
                ocr->normal[0] = oc->_N_x[i * oc->_N + j];
-               ocr->normal[1] = oc->_N_y /*oc->_N_y[i*oc->_N+j] (MEM01)*/;
+               ocr->normal[1] = oc->_N_y  /* oc->_N_y[i * oc->_N + j] (MEM01) */;
                ocr->normal[2] = oc->_N_z[i * oc->_N + j];
 
                normalize_v3(ocr->normal);
@@ -490,217 +495,302 @@ void BKE_ocean_eval_ij(struct Ocean *oc, struct OceanResult *ocr, int i, int j)
        BLI_rw_mutex_unlock(&oc->oceanmutex);
 }
 
-void BKE_simulate_ocean(struct Ocean *o, float t, float scale, float chop_amount)
+typedef struct OceanSimulateData {
+       Ocean *o;
+       float t;
+       float scale;
+       float chop_amount;
+} OceanSimulateData;
+
+static void ocean_compute_htilda(
+        void *__restrict userdata,
+        const int i,
+        const ParallelRangeTLS *__restrict UNUSED(tls))
+{
+       OceanSimulateData *osd = userdata;
+       const Ocean *o = osd->o;
+       const float scale = osd->scale;
+       const float t = osd->t;
+
+       int j;
+
+       /* note the <= _N/2 here, see the fftw doco about the mechanics of the complex->real fft storage */
+       for (j = 0; j <= o->_N / 2; ++j) {
+               fftw_complex exp_param1;
+               fftw_complex exp_param2;
+               fftw_complex conj_param;
+
+               init_complex(exp_param1, 0.0, omega(o->_k[i * (1 + o->_N / 2) + j], o->_depth) * t);
+               init_complex(exp_param2, 0.0, -omega(o->_k[i * (1 + o->_N / 2) + j], o->_depth) * t);
+               exp_complex(exp_param1, exp_param1);
+               exp_complex(exp_param2, exp_param2);
+               conj_complex(conj_param, o->_h0_minus[i * o->_N + j]);
+
+               mul_complex_c(exp_param1, o->_h0[i * o->_N + j], exp_param1);
+               mul_complex_c(exp_param2, conj_param, exp_param2);
+
+               add_comlex_c(o->_htilda[i * (1 + o->_N / 2) + j], exp_param1, exp_param2);
+               mul_complex_f(o->_fft_in[i * (1 + o->_N / 2) + j], o->_htilda[i * (1 + o->_N / 2) + j], scale);
+       }
+}
+
+static void ocean_compute_displacement_y(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
 {
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+
+       fftw_execute(o->_disp_y_plan);
+}
+
+static void ocean_compute_displacement_x(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       const float scale = osd->scale;
+       const float chop_amount = osd->chop_amount;
        int i, j;
 
-       scale *= o->normalize_factor;
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
+                       fftw_complex minus_i;
+
+                       init_complex(minus_i, 0.0, -1.0);
+                       init_complex(mul_param, -scale, 0);
+                       mul_complex_f(mul_param, mul_param, chop_amount);
+                       mul_complex_c(mul_param, mul_param, minus_i);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param,
+                                     ((o->_k[i * (1 + o->_N / 2) + j] == 0.0f) ?
+                                      0.0f :
+                                      o->_kx[i] / o->_k[i * (1 + o->_N / 2) + j]));
+                       init_complex(o->_fft_in_x[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_disp_x_plan);
+}
 
-       BLI_rw_mutex_lock(&o->oceanmutex, THREAD_LOCK_WRITE);
+static void ocean_compute_displacement_z(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       const float scale = osd->scale;
+       const float chop_amount = osd->chop_amount;
+       int i, j;
+
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
+                       fftw_complex minus_i;
+
+                       init_complex(minus_i, 0.0, -1.0);
+                       init_complex(mul_param, -scale, 0);
+                       mul_complex_f(mul_param, mul_param, chop_amount);
+                       mul_complex_c(mul_param, mul_param, minus_i);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param,
+                                     ((o->_k[i * (1 + o->_N / 2) + j] == 0.0f) ?
+                                      0.0f :
+                                      o->_kz[j] / o->_k[i * (1 + o->_N / 2) + j]));
+                       init_complex(o->_fft_in_z[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_disp_z_plan);
+}
 
-       // compute a new htilda
-#pragma omp parallel for private(i, j)
-       for (i = 0; i  < o->_M; ++i) {
-               // note the <= _N/2 here, see the fftw doco about
-               // the mechanics of the complex->real fft storage
-               for (j  = 0; j  <= o->_N / 2; ++j) {
-                       fftw_complex exp_param1;
-                       fftw_complex exp_param2;
-                       fftw_complex conj_param;
+static void ocean_compute_jacobian_jxx(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       const float chop_amount = osd->chop_amount;
+       int i, j;
 
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
 
-                       init_complex(exp_param1, 0.0, omega(o->_k[i * (1 + o->_N / 2) + j], o->_depth) * t);
-                       init_complex(exp_param2, 0.0, -omega(o->_k[i * (1 + o->_N / 2) + j], o->_depth) * t);
-                       exp_complex(exp_param1, exp_param1);
-                       exp_complex(exp_param2, exp_param2);
-                       conj_complex(conj_param, o->_h0_minus[i * o->_N + j]);
+                       /* init_complex(mul_param, -scale, 0); */
+                       init_complex(mul_param, -1, 0);
 
-                       mul_complex_c(exp_param1, o->_h0[i * o->_N + j], exp_param1);
-                       mul_complex_c(exp_param2, conj_param, exp_param2);
+                       mul_complex_f(mul_param, mul_param, chop_amount);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param,
+                                     ((o->_k[i * (1 + o->_N / 2) + j] == 0.0f) ?
+                                      0.0f :
+                                      o->_kx[i] * o->_kx[i] / o->_k[i * (1 + o->_N / 2) + j]));
+                       init_complex(o->_fft_in_jxx[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_Jxx_plan);
 
-                       add_comlex_c(o->_htilda[i * (1 + o->_N / 2) + j], exp_param1, exp_param2);
-                       mul_complex_f(o->_fft_in[i * (1 + o->_N / 2) + j], o->_htilda[i * (1 + o->_N / 2) + j], scale);
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j < o->_N; ++j) {
+                       o->_Jxx[i * o->_N + j] += 1.0;
                }
        }
+}
 
-#pragma omp parallel sections private(i, j)
-       {
+static void ocean_compute_jacobian_jzz(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       const float chop_amount = osd->chop_amount;
+       int i, j;
 
-#pragma omp section
-               {
-                       if (o->_do_disp_y) {
-                               // y displacement
-                               fftw_execute(o->_disp_y_plan);
-                       }
-               } // section 1
-
-#pragma omp section
-               {
-                       if (o->_do_chop) {
-                               // x displacement
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-                                               fftw_complex minus_i;
-
-                                               init_complex(minus_i, 0.0, -1.0);
-                                               init_complex(mul_param, -scale, 0);
-                                               mul_complex_f(mul_param, mul_param, chop_amount);
-                                               mul_complex_c(mul_param, mul_param, minus_i);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, (o->_k[i * (1 + o->_N / 2) + j] == 0.0 ? 0.0 : o->_kx[i] / o->_k[i * (1 + o->_N / 2) + j]));
-                                               init_complex(o->_fft_in_x[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_disp_x_plan);
-                       }
-               } //section 2
-
-#pragma omp section
-               {
-                       if (o->_do_chop) {
-                               // z displacement
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-                                               fftw_complex minus_i;
-
-                                               init_complex(minus_i, 0.0, -1.0);
-                                               init_complex(mul_param, -scale, 0);
-                                               mul_complex_f(mul_param, mul_param, chop_amount);
-                                               mul_complex_c(mul_param, mul_param, minus_i);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, (o->_k[i * (1 + o->_N / 2) + j] == 0.0 ? 0.0 : o->_kz[j] / o->_k[i * (1 + o->_N / 2) + j]));
-                                               init_complex(o->_fft_in_z[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_disp_z_plan);
-                       }
-               } // section 3
-
-#pragma omp section
-               {
-                       if (o->_do_jacobian) {
-                               // Jxx
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-
-                                               //init_complex(mul_param, -scale, 0);
-                                               init_complex(mul_param, -1, 0);
-
-                                               mul_complex_f(mul_param, mul_param, chop_amount);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, (o->_k[i * (1 + o->_N / 2) + j] == 0.0 ? 0.0 : o->_kx[i] * o->_kx[i] / o->_k[i * (1 + o->_N / 2) + j]));
-                                               init_complex(o->_fft_in_jxx[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_Jxx_plan);
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
 
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  < o->_N; ++j) {
-                                               o->_Jxx[i * o->_N + j] += 1.0;
-                                       }
-                               }
-                       }
-               } // section 4
-
-#pragma omp section
-               {
-                       if (o->_do_jacobian) {
-                               // Jzz
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-
-                                               //init_complex(mul_param, -scale, 0);
-                                               init_complex(mul_param, -1, 0);
-
-                                               mul_complex_f(mul_param, mul_param, chop_amount);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, (o->_k[i * (1 + o->_N / 2) + j] == 0.0 ? 0.0 : o->_kz[j] * o->_kz[j] / o->_k[i * (1 + o->_N / 2) + j]));
-                                               init_complex(o->_fft_in_jzz[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_Jzz_plan);
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  < o->_N; ++j) {
-                                               o->_Jzz[i * o->_N + j] += 1.0;
-                                       }
-                               }
-                       }
-               } // section 5
-
-#pragma omp section
-               {
-                       if (o->_do_jacobian) {
-                               // Jxz
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-
-                                               //init_complex(mul_param, -scale, 0);
-                                               init_complex(mul_param, -1, 0);
-
-                                               mul_complex_f(mul_param, mul_param, chop_amount);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, (o->_k[i * (1 + o->_N / 2) + j] == 0.0f ? 0.0f : o->_kx[i] * o->_kz[j] / o->_k[i * (1 + o->_N / 2) + j]));
-                                               init_complex(o->_fft_in_jxz[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_Jxz_plan);
-                       }
-               } // section 6
-
-#pragma omp section
-               {
-                       // fft normals
-                       if (o->_do_normals) {
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-
-                                               init_complex(mul_param, 0.0, -1.0);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, o->_kx[i]);
-                                               init_complex(o->_fft_in_nx[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_N_x_plan);
+                       /* init_complex(mul_param, -scale, 0); */
+                       init_complex(mul_param, -1, 0);
 
-                       }
-               } // section 7
-
-#pragma omp section
-               {
-                       if (o->_do_normals) {
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  <= o->_N / 2; ++j) {
-                                               fftw_complex mul_param;
-
-                                               init_complex(mul_param, 0.0, -1.0);
-                                               mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
-                                               mul_complex_f(mul_param, mul_param, o->_kz[i]);
-                                               init_complex(o->_fft_in_nz[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
-                                       }
-                               }
-                               fftw_execute(o->_N_z_plan);
+                       mul_complex_f(mul_param, mul_param, chop_amount);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param,
+                                     ((o->_k[i * (1 + o->_N / 2) + j] == 0.0f) ?
+                                      0.0f :
+                                      o->_kz[j] * o->_kz[j] / o->_k[i * (1 + o->_N / 2) + j]));
+                       init_complex(o->_fft_in_jzz[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_Jzz_plan);
+
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j < o->_N; ++j) {
+                       o->_Jzz[i * o->_N + j] += 1.0;
+               }
+       }
+}
+
+static void ocean_compute_jacobian_jxz(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       const float chop_amount = osd->chop_amount;
+       int i, j;
+
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
+
+                       /* init_complex(mul_param, -scale, 0); */
+                       init_complex(mul_param, -1, 0);
+
+                       mul_complex_f(mul_param, mul_param, chop_amount);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param,
+                                     ((o->_k[i * (1 + o->_N / 2) + j] == 0.0f) ?
+                                      0.0f :
+                                      o->_kx[i] * o->_kz[j] / o->_k[i * (1 + o->_N / 2) + j]));
+                       init_complex(o->_fft_in_jxz[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_Jxz_plan);
+}
+
+static void ocean_compute_normal_x(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       int i, j;
+
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
+
+                       init_complex(mul_param, 0.0, -1.0);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param, o->_kx[i]);
+                       init_complex(o->_fft_in_nx[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_N_x_plan);
+}
+
+static void ocean_compute_normal_z(TaskPool * __restrict pool, void *UNUSED(taskdata), int UNUSED(threadid))
+{
+       OceanSimulateData *osd = BLI_task_pool_userdata(pool);
+       const Ocean *o = osd->o;
+       int i, j;
+
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j <= o->_N / 2; ++j) {
+                       fftw_complex mul_param;
+
+                       init_complex(mul_param, 0.0, -1.0);
+                       mul_complex_c(mul_param, mul_param, o->_htilda[i * (1 + o->_N / 2) + j]);
+                       mul_complex_f(mul_param, mul_param, o->_kz[i]);
+                       init_complex(o->_fft_in_nz[i * (1 + o->_N / 2) + j], real_c(mul_param), image_c(mul_param));
+               }
+       }
+       fftw_execute(o->_N_z_plan);
+}
+
+void BKE_ocean_simulate(struct Ocean *o, float t, float scale, float chop_amount)
+{
+       TaskScheduler *scheduler = BLI_task_scheduler_get();
+       TaskPool *pool;
+
+       OceanSimulateData osd;
+
+       scale *= o->normalize_factor;
+
+       osd.o = o;
+       osd.t = t;
+       osd.scale = scale;
+       osd.chop_amount = chop_amount;
+
+       pool = BLI_task_pool_create(scheduler, &osd);
+
+       BLI_rw_mutex_lock(&o->oceanmutex, THREAD_LOCK_WRITE);
+
+       /* Note about multi-threading here: we have to run a first set of computations (htilda one) before we can run
+        * all others, since they all depend on it.
+        * So we make a first parallelized forloop run for htilda, and then pack all other computations into
+        * a set of parallel tasks.
+        * This is not optimal in all cases, but remains reasonably simple and should be OK most of the time. */
+
+       /* compute a new htilda */
+       ParallelRangeSettings settings;
+       BLI_parallel_range_settings_defaults(&settings);
+       settings.use_threading = (o->_M > 16);
+       BLI_task_parallel_range(0, o->_M, &osd, ocean_compute_htilda, &settings);
+
+       if (o->_do_disp_y) {
+               BLI_task_pool_push(pool, ocean_compute_displacement_y, NULL, false, TASK_PRIORITY_HIGH);
+       }
+
+       if (o->_do_chop) {
+               BLI_task_pool_push(pool, ocean_compute_displacement_x, NULL, false, TASK_PRIORITY_HIGH);
+               BLI_task_pool_push(pool, ocean_compute_displacement_z, NULL, false, TASK_PRIORITY_HIGH);
+       }
+
+       if (o->_do_jacobian) {
+               BLI_task_pool_push(pool, ocean_compute_jacobian_jxx, NULL, false, TASK_PRIORITY_HIGH);
+               BLI_task_pool_push(pool, ocean_compute_jacobian_jzz, NULL, false, TASK_PRIORITY_HIGH);
+               BLI_task_pool_push(pool, ocean_compute_jacobian_jxz, NULL, false, TASK_PRIORITY_HIGH);
+       }
+
+       if (o->_do_normals) {
+               BLI_task_pool_push(pool, ocean_compute_normal_x, NULL, false, TASK_PRIORITY_HIGH);
+               BLI_task_pool_push(pool, ocean_compute_normal_z, NULL, false, TASK_PRIORITY_HIGH);
 
 #if 0
-                               for (i = 0; i  < o->_M; ++i) {
-                                       for (j  = 0; j  < o->_N; ++j) {
-                                               o->_N_y[i * o->_N + j] = 1.0f / scale;
-                                       }
-                               }
-                               (MEM01)
-#endif
-                               o->_N_y = 1.0f / scale;
+               for (i = 0; i < o->_M; ++i) {
+                       for (j = 0; j < o->_N; ++j) {
+                               o->_N_y[i * o->_N + j] = 1.0f / scale;
                        }
-               } // section 8
+               }
+               (MEM01)
+#endif
+               o->_N_y = 1.0f / scale;
+       }
 
-       } // omp sections
+       BLI_task_pool_work_and_wait(pool);
 
        BLI_rw_mutex_unlock(&o->oceanmutex);
+
+       BLI_task_pool_free(pool);
 }
 
 static void set_height_normalize_factor(struct Ocean *oc)
@@ -714,28 +804,29 @@ static void set_height_normalize_factor(struct Ocean *oc)
 
        oc->normalize_factor = 1.0;
 
-       BKE_simulate_ocean(oc, 0.0, 1.0, 0);
+       BKE_ocean_simulate(oc, 0.0, 1.0, 0);
 
        BLI_rw_mutex_lock(&oc->oceanmutex, THREAD_LOCK_READ);
 
        for (i = 0; i < oc->_M; ++i) {
                for (j = 0; j < oc->_N; ++j) {
-                       if (max_h < fabsf(oc->_disp_y[i * oc->_N + j])) {
-                               max_h = fabsf(oc->_disp_y[i * oc->_N + j]);
+                       if (max_h < fabs(oc->_disp_y[i * oc->_N + j])) {
+                               max_h = fabs(oc->_disp_y[i * oc->_N + j]);
                        }
                }
        }
 
        BLI_rw_mutex_unlock(&oc->oceanmutex);
 
-       if (max_h == 0.0f) max_h = 0.00001f;  // just in case ...
+       if (max_h == 0.0f)
+               max_h = 0.00001f;  /* just in case ... */
 
        res = 1.0f / (max_h);
 
        oc->normalize_factor = res;
 }
 
-struct Ocean *BKE_add_ocean(void)
+struct Ocean *BKE_ocean_add(void)
 {
        Ocean *oc = MEM_callocN(sizeof(Ocean), "ocean sim data");
 
@@ -744,9 +835,11 @@ struct Ocean *BKE_add_ocean(void)
        return oc;
 }
 
-void BKE_init_ocean(struct Ocean *o, int M, int N, float Lx, float Lz, float V, float l, float A, float w, float damp,
-                    float alignment, float depth, float time, short do_height_field, short do_chop, short do_normals, short do_jacobian, int seed)
+void BKE_ocean_init(struct Ocean *o, int M, int N, float Lx, float Lz, float V, float l, float A, float w, float damp,
+                    float alignment, float depth, float time, short do_height_field, short do_chop, short do_normals,
+                    short do_jacobian, int seed)
 {
+       RNG *rng;
        int i, j, ii;
 
        BLI_rw_mutex_lock(&o->oceanmutex, THREAD_LOCK_WRITE);
@@ -763,8 +856,8 @@ void BKE_init_ocean(struct Ocean *o, int M, int N, float Lx, float Lz, float V,
        o->_Lx = Lx;
        o->_Lz = Lz;
        o->_wx = cos(w);
-       o->_wz = -sin(w); // wave direction
-       o->_L = V * V / GRAVITY;  // largest wave for a given velocity V
+       o->_wz = -sin(w); /* wave direction */
+       o->_L = V * V / GRAVITY;  /* largest wave for a given velocity V */
        o->time = time;
 
        o->_do_disp_y = do_height_field;
@@ -778,54 +871,56 @@ void BKE_init_ocean(struct Ocean *o, int M, int N, float Lx, float Lz, float V,
        o->_kx = (float *) MEM_mallocN(o->_M * sizeof(float), "ocean_kx");
        o->_kz = (float *) MEM_mallocN(o->_N * sizeof(float), "ocean_kz");
 
-       // make this robust in the face of erroneous usage
+       /* make this robust in the face of erroneous usage */
        if (o->_Lx == 0.0f)
                o->_Lx = 0.001f;
 
        if (o->_Lz == 0.0f)
                o->_Lz = 0.001f;
 
-       // the +ve components and DC
+       /* the +ve components and DC */
        for (i = 0; i <= o->_M / 2; ++i)
                o->_kx[i] = 2.0f * (float)M_PI * i / o->_Lx;
 
-       // the -ve components
+       /* the -ve components */
        for (i = o->_M - 1, ii = 0; i > o->_M / 2; --i, ++ii)
                o->_kx[i] = -2.0f * (float)M_PI * ii / o->_Lx;
 
-       // the +ve components and DC
+       /* the +ve components and DC */
        for (i = 0; i <= o->_N / 2; ++i)
                o->_kz[i] = 2.0f * (float)M_PI * i / o->_Lz;
 
-       // the -ve components
+       /* the -ve components */
        for (i = o->_N - 1, ii = 0; i > o->_N / 2; --i, ++ii)
                o->_kz[i] = -2.0f * (float)M_PI * ii / o->_Lz;
 
-       // pre-calculate the k matrix
-       for (i = 0; i  < o->_M; ++i)
-               for (j  = 0; j  <= o->_N / 2; ++j)
+       /* pre-calculate the k matrix */
+       for (i = 0; i < o->_M; ++i)
+               for (j = 0; j <= o->_N / 2; ++j)
                        o->_k[i * (1 + o->_N / 2) + j] = sqrt(o->_kx[i] * o->_kx[i] + o->_kz[j] * o->_kz[j]);
 
        /*srand(seed);*/
-       BLI_srand(seed);
+       rng = BLI_rng_new(seed);
 
-       for (i = 0; i  < o->_M; ++i) {
-               for (j = 0; j  < o->_N; ++j) {
-                       float r1 = gaussRand();
-                       float r2 = gaussRand();
+       for (i = 0; i < o->_M; ++i) {
+               for (j = 0; j < o->_N; ++j) {
+                       float r1 = gaussRand(rng);
+                       float r2 = gaussRand(rng);
 
                        fftw_complex r1r2;
                        init_complex(r1r2, r1, r2);
-                       mul_complex_f(o->_h0[i * o->_N + j], r1r2, (float)(sqrt(Ph(o,  o->_kx[i], o->_kz[j]) / 2.0f)));
+                       mul_complex_f(o->_h0[i * o->_N + j], r1r2, (float)(sqrt(Ph(o, o->_kx[i], o->_kz[j]) / 2.0f)));
                        mul_complex_f(o->_h0_minus[i * o->_N + j], r1r2, (float)(sqrt(Ph(o, -o->_kx[i], -o->_kz[j]) / 2.0f)));
                }
        }
 
-       o->_fft_in = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in");
-       o->_htilda = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_htilda");
+       o->_fft_in = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in");
+       o->_htilda = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_htilda");
+
+       BLI_thread_lock(LOCK_FFTW);
 
        if (o->_do_disp_y) {
-               o->_disp_y = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_disp_y");
+               o->_disp_y = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_disp_y");
                o->_disp_y_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in, o->_disp_y, FFTW_ESTIMATE);
        }
 
@@ -833,50 +928,58 @@ void BKE_init_ocean(struct Ocean *o, int M, int N, float Lx, float Lz, float V,
                o->_fft_in_nx = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_nx");
                o->_fft_in_nz = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_nz");
 
-               o->_N_x = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_N_x");
-               /*o->_N_y = (float*) fftwf_malloc(o->_M * o->_N * sizeof(float)); (MEM01)*/
-               o->_N_z = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_N_z");
+               o->_N_x = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_N_x");
+               /* o->_N_y = (float *) fftwf_malloc(o->_M * o->_N * sizeof(float)); (MEM01) */
+               o->_N_z = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_N_z");
 
                o->_N_x_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_nx, o->_N_x, FFTW_ESTIMATE);
                o->_N_z_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_nz, o->_N_z, FFTW_ESTIMATE);
        }
 
        if (o->_do_chop) {
-               o->_fft_in_x = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_x");
-               o->_fft_in_z = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_z");
+               o->_fft_in_x = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_x");
+               o->_fft_in_z = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_z");
 
-               o->_disp_x = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_disp_x");
-               o->_disp_z = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_disp_z");
+               o->_disp_x = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_disp_x");
+               o->_disp_z = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_disp_z");
 
                o->_disp_x_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_x, o->_disp_x, FFTW_ESTIMATE);
                o->_disp_z_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_z, o->_disp_z, FFTW_ESTIMATE);
        }
        if (o->_do_jacobian) {
-               o->_fft_in_jxx = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_jxx");
-               o->_fft_in_jzz = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_jzz");
-               o->_fft_in_jxz = (fftw_complex *) MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex), "ocean_fft_in_jxz");
+               o->_fft_in_jxx = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex),
+                                                            "ocean_fft_in_jxx");
+               o->_fft_in_jzz = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex),
+                                                            "ocean_fft_in_jzz");
+               o->_fft_in_jxz = (fftw_complex *)MEM_mallocN(o->_M * (1 + o->_N / 2) * sizeof(fftw_complex),
+                                                            "ocean_fft_in_jxz");
 
-               o->_Jxx = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_Jxx");
-               o->_Jzz = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_Jzz");
-               o->_Jxz = (double *) MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_Jxz");
+               o->_Jxx = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_Jxx");
+               o->_Jzz = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_Jzz");
+               o->_Jxz = (double *)MEM_mallocN(o->_M * o->_N * sizeof(double), "ocean_Jxz");
 
                o->_Jxx_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_jxx, o->_Jxx, FFTW_ESTIMATE);
                o->_Jzz_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_jzz, o->_Jzz, FFTW_ESTIMATE);
                o->_Jxz_plan = fftw_plan_dft_c2r_2d(o->_M, o->_N, o->_fft_in_jxz, o->_Jxz, FFTW_ESTIMATE);
        }
 
+       BLI_thread_unlock(LOCK_FFTW);
+
        BLI_rw_mutex_unlock(&o->oceanmutex);
 
        set_height_normalize_factor(o);
 
+       BLI_rng_free(rng);
 }
 
-void BKE_free_ocean_data(struct Ocean *oc)
+void BKE_ocean_free_data(struct Ocean *oc)
 {
        if (!oc) return;
 
        BLI_rw_mutex_lock(&oc->oceanmutex, THREAD_LOCK_WRITE);
 
+       BLI_thread_lock(LOCK_FFTW);
+
        if (oc->_do_disp_y) {
                fftw_destroy_plan(oc->_disp_y_plan);
                MEM_freeN(oc->_disp_y);
@@ -913,6 +1016,8 @@ void BKE_free_ocean_data(struct Ocean *oc)
                MEM_freeN(oc->_Jxz);
        }
 
+       BLI_thread_unlock(LOCK_FFTW);
+
        if (oc->_fft_in)
                MEM_freeN(oc->_fft_in);
 
@@ -929,11 +1034,11 @@ void BKE_free_ocean_data(struct Ocean *oc)
        BLI_rw_mutex_unlock(&oc->oceanmutex);
 }
 
-void BKE_free_ocean(struct Ocean *oc)
+void BKE_ocean_free(struct Ocean *oc)
 {
        if (!oc) return;
 
-       BKE_free_ocean_data(oc);
+       BKE_ocean_free_data(oc);
        BLI_rw_mutex_end(&oc->oceanmutex);
 
        MEM_freeN(oc);
@@ -969,7 +1074,7 @@ static void cache_filename(char *string, const char *path, const char *relbase,
 
        BLI_join_dirfile(cachepath, sizeof(cachepath), path, fname);
 
-       BKE_makepicstring(string, cachepath, relbase, frame, R_IMF_IMTYPE_OPENEXR, 1, TRUE);
+       BKE_image_path_from_imtype(string, cachepath, relbase, frame, R_IMF_IMTYPE_OPENEXR, true, true, "");
 }
 
 /* silly functions but useful to inline when the args do a lot of indirections */
@@ -988,7 +1093,7 @@ MINLINE void value_to_rgba_unit_alpha(float r_rgba[4], const float value)
        r_rgba[3] = 1.0f;
 }
 
-void BKE_free_ocean_cache(struct OceanCache *och)
+void BKE_ocean_free_cache(struct OceanCache *och)
 {
        int i, f = 0;
 
@@ -1078,8 +1183,7 @@ void BKE_ocean_cache_eval_ij(struct OceanCache *och, struct OceanResult *ocr, in
        }
 }
 
-struct OceanCache *BKE_init_ocean_cache(const char *bakepath, const char *relbase,
-                                        int start, int end, float wave_scale,
+struct OceanCache *BKE_ocean_init_cache(const char *bakepath, const char *relbase, int start, int end, float wave_scale,
                                         float chop_amount, float foam_coverage, float foam_fade, int resolution)
 {
        OceanCache *och = MEM_callocN(sizeof(OceanCache), "ocean cache data");
@@ -1106,7 +1210,7 @@ struct OceanCache *BKE_init_ocean_cache(const char *bakepath, const char *relbas
        return och;
 }
 
-void BKE_simulate_ocean_cache(struct OceanCache *och, int frame)
+void BKE_ocean_simulate_cache(struct OceanCache *och, int frame)
 {
        char string[FILE_MAX];
        int f = frame;
@@ -1114,30 +1218,44 @@ void BKE_simulate_ocean_cache(struct OceanCache *och, int frame)
        /* ibufs array is zero based, but filenames are based on frame numbers */
        /* still need to clamp frame numbers to valid range of images on disk though */
        CLAMP(frame, och->start, och->end);
-       f = frame - och->start; // shift to 0 based
+       f = frame - och->start; /* shift to 0 based */
 
        /* if image is already loaded in mem, return */
        if (och->ibufs_disp[f] != NULL) return;
 
+       /* use default color spaces since we know for sure cache files were saved with default settings too */
 
        cache_filename(string, och->bakepath, och->relbase, frame, CACHE_TYPE_DISPLACE);
-       och->ibufs_disp[f] = IMB_loadiffname(string, 0);
-       //if (och->ibufs_disp[f] == NULL) printf("error loading %s\n", string);
-       //else printf("loaded cache %s\n", string);
+       och->ibufs_disp[f] = IMB_loadiffname(string, 0, NULL);
+#if 0
+       if (och->ibufs_disp[f] == NULL)
+               printf("error loading %s\n", string);
+       else
+               printf("loaded cache %s\n", string);
+#endif
 
        cache_filename(string, och->bakepath, och->relbase, frame, CACHE_TYPE_FOAM);
-       och->ibufs_foam[f] = IMB_loadiffname(string, 0);
-       //if (och->ibufs_foam[f] == NULL) printf("error loading %s\n", string);
-       //else printf("loaded cache %s\n", string);
+       och->ibufs_foam[f] = IMB_loadiffname(string, 0, NULL);
+#if 0
+       if (och->ibufs_foam[f] == NULL)
+               printf("error loading %s\n", string);
+       else
+               printf("loaded cache %s\n", string);
+#endif
 
        cache_filename(string, och->bakepath, och->relbase, frame, CACHE_TYPE_NORMAL);
-       och->ibufs_norm[f] = IMB_loadiffname(string, 0);
-       //if (och->ibufs_norm[f] == NULL) printf("error loading %s\n", string);
-       //else printf("loaded cache %s\n", string);
+       och->ibufs_norm[f] = IMB_loadiffname(string, 0, NULL);
+#if 0
+       if (och->ibufs_norm[f] == NULL)
+               printf("error loading %s\n", string);
+       else
+               printf("loaded cache %s\n", string);
+#endif
 }
 
 
-void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(void *, float progress, int *cancel), void *update_cb_data)
+void BKE_ocean_bake(struct Ocean *o, struct OceanCache *och, void (*update_cb)(void *, float progress, int *cancel),
+                    void *update_cb_data)
 {
        /* note: some of these values remain uninitialized unless certain options
         * are enabled, take care that BKE_ocean_eval_ij() initializes a member
@@ -1154,13 +1272,14 @@ void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(v
        int res_x = och->resolution_x;
        int res_y = och->resolution_y;
        char string[FILE_MAX];
+       //RNG *rng;
 
        if (!o) return;
 
        if (o->_do_jacobian) prev_foam = MEM_callocN(res_x * res_y * sizeof(float), "previous frame foam bake data");
        else prev_foam = NULL;
 
-       BLI_srand(0);
+       //rng = BLI_rng_new(0);
 
        /* setup image format */
        imf.imtype = R_IMF_IMTYPE_OPENEXR;
@@ -1174,9 +1293,7 @@ void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(v
                ibuf_disp = IMB_allocImBuf(res_x, res_y, 32, IB_rectfloat);
                ibuf_normal = IMB_allocImBuf(res_x, res_y, 32, IB_rectfloat);
 
-               ibuf_disp->profile = ibuf_foam->profile = ibuf_normal->profile = IB_PROFILE_LINEAR_RGB;
-
-               BKE_simulate_ocean(o, och->time[i], och->wave_scale, och->chop_amount);
+               BKE_ocean_simulate(o, och->time[i], och->wave_scale, och->chop_amount);
 
                /* add new foam */
                for (y = 0; y < res_y; y++) {
@@ -1200,13 +1317,13 @@ void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(v
                                                pr = prev_foam[res_x * y + x];
                                        }
 
-                                       /* r = BLI_frand(); */ /* UNUSED */ // randomly reduce foam
+                                       /* r = BLI_rng_get_float(rng); */ /* UNUSED */ /* randomly reduce foam */
 
-                                       //pr = pr * och->foam_fade;             // overall fade
+                                       /* pr = pr * och->foam_fade; */         /* overall fade */
 
-                                       // remember ocean coord sys is Y up!
-                                       // break up the foam where height (Y) is low (wave valley),
-                                       // and X and Z displacement is greatest
+                                       /* remember ocean coord sys is Y up!
+                                        * break up the foam where height (Y) is low (wave valley), and X and Z displacement is greatest
+                                        */
 
 #if 0
                                        vec[0] = ocr.disp[0];
@@ -1222,22 +1339,27 @@ void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(v
                                        neg_eplus = ocr.Eplus[2] < 0.0f ? 1.0f + ocr.Eplus[2] : 1.0f;
                                        neg_eplus = neg_eplus < 0.0f ? 0.0f : neg_eplus;
 
-                                       //if (ocr.disp[1] < 0.0 || r > och->foam_fade)
-                                       //      pr *= och->foam_fade;
+#if 0
+                                       if (ocr.disp[1] < 0.0 || r > och->foam_fade)
+                                               pr *= och->foam_fade;
 
 
-                                       //pr = pr * (1.0 - hor_stretch) * ocr.disp[1];
-                                       //pr = pr * neg_disp * neg_eplus;
+                                       pr = pr * (1.0 - hor_stretch) * ocr.disp[1];
+                                       pr = pr * neg_disp * neg_eplus;
+#endif
 
-                                       if (pr < 1.0f) pr *= pr;
+                                       if (pr < 1.0f)
+                                               pr *= pr;
 
                                        pr *= och->foam_fade * (0.75f + neg_eplus * 0.25f);
 
-
-                                       foam_result = pr + ocr.foam;
+                                       /* A full clamping should not be needed! */
+                                       foam_result = min_ff(pr + ocr.foam, 1.0f);
 
                                        prev_foam[res_x * y + x] = foam_result;
 
+                                       /*foam_result = min_ff(foam_result, 1.0f); */
+
                                        value_to_rgba_unit_alpha(&ibuf_foam->rect_float[4 * (res_x * y + x)], foam_result);
                                }
 
@@ -1253,13 +1375,13 @@ void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(v
                        printf("Cannot save Displacement File Output to %s\n", string);
 
                if (o->_do_jacobian) {
-                       cache_filename(string, och->bakepath, och->relbase,  f, CACHE_TYPE_FOAM);
+                       cache_filename(string, och->bakepath, och->relbase, f, CACHE_TYPE_FOAM);
                        if (0 == BKE_imbuf_write(ibuf_foam, string, &imf))
                                printf("Cannot save Foam File Output to %s\n", string);
                }
 
                if (o->_do_normals) {
-                       cache_filename(string, och->bakepath,  och->relbase, f, CACHE_TYPE_NORMAL);
+                       cache_filename(string, och->bakepath, och->relbase, f, CACHE_TYPE_NORMAL);
                        if (0 == BKE_imbuf_write(ibuf_normal, string, &imf))
                                printf("Cannot save Normal File Output to %s\n", string);
                }
@@ -1274,15 +1396,17 @@ void BKE_bake_ocean(struct Ocean *o, struct OceanCache *och, void (*update_cb)(v
 
                if (cancel) {
                        if (prev_foam) MEM_freeN(prev_foam);
+                       //BLI_rng_free(rng);
                        return;
                }
        }
 
+       //BLI_rng_free(rng);
        if (prev_foam) MEM_freeN(prev_foam);
        och->baked = 1;
 }
 
-#else // WITH_OCEANSIM
+#else /* WITH_OCEANSIM */
 
 /* stub */
 typedef struct Ocean {
@@ -1300,8 +1424,9 @@ void BKE_ocean_eval_uv(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr)
 {
 }
 
-// use catmullrom interpolation rather than linear
-void BKE_ocean_eval_uv_catrom(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr), float UNUSED(u), float UNUSED(v))
+/* use catmullrom interpolation rather than linear */
+void BKE_ocean_eval_uv_catrom(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr), float UNUSED(u),
+                              float UNUSED(v))
 {
 }
 
@@ -1309,7 +1434,8 @@ void BKE_ocean_eval_xz(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr)
 {
 }
 
-void BKE_ocean_eval_xz_catrom(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr), float UNUSED(x), float UNUSED(z))
+void BKE_ocean_eval_xz_catrom(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr), float UNUSED(x),
+                              float UNUSED(z))
 {
 }
 
@@ -1317,27 +1443,29 @@ void BKE_ocean_eval_ij(struct Ocean *UNUSED(oc), struct OceanResult *UNUSED(ocr)
 {
 }
 
-void BKE_simulate_ocean(struct Ocean *UNUSED(o), float UNUSED(t), float UNUSED(scale), float UNUSED(chop_amount))
+void BKE_ocean_simulate(struct Ocean *UNUSED(o), float UNUSED(t), float UNUSED(scale), float UNUSED(chop_amount))
 {
 }
 
-struct Ocean *BKE_add_ocean(void)
+struct Ocean *BKE_ocean_add(void)
 {
        Ocean *oc = MEM_callocN(sizeof(Ocean), "ocean sim data");
 
        return oc;
 }
 
-void BKE_init_ocean(struct Ocean *UNUSED(o), int UNUSED(M), int UNUSED(N), float UNUSED(Lx), float UNUSED(Lz), float UNUSED(V), float UNUSED(l), float UNUSED(A), float UNUSED(w), float UNUSED(damp),
-                    float UNUSED(alignment), float UNUSED(depth), float UNUSED(time), short UNUSED(do_height_field), short UNUSED(do_chop), short UNUSED(do_normals), short UNUSED(do_jacobian), int UNUSED(seed))
+void BKE_ocean_init(struct Ocean *UNUSED(o), int UNUSED(M), int UNUSED(N), float UNUSED(Lx), float UNUSED(Lz),
+                    float UNUSED(V), float UNUSED(l), float UNUSED(A), float UNUSED(w), float UNUSED(damp),
+                    float UNUSED(alignment), float UNUSED(depth), float UNUSED(time), short UNUSED(do_height_field),
+                    short UNUSED(do_chop), short UNUSED(do_normals), short UNUSED(do_jacobian), int UNUSED(seed))
 {
 }
 
-void BKE_free_ocean_data(struct Ocean *UNUSED(oc))
+void BKE_ocean_free_data(struct Ocean *UNUSED(oc))
 {
 }
 
-void BKE_free_ocean(struct Ocean *oc)
+void BKE_ocean_free(struct Ocean *oc)
 {
        if (!oc) return;
        MEM_freeN(oc);
@@ -1347,37 +1475,40 @@ void BKE_free_ocean(struct Ocean *oc)
 /* ********* Baking/Caching ********* */
 
 
-void BKE_free_ocean_cache(struct OceanCache *och)
+void BKE_ocean_free_cache(struct OceanCache *och)
 {
        if (!och) return;
 
        MEM_freeN(och);
 }
 
-void BKE_ocean_cache_eval_uv(struct OceanCache *UNUSED(och), struct OceanResult *UNUSED(ocr), int UNUSED(f), float UNUSED(u), float UNUSED(v))
+void BKE_ocean_cache_eval_uv(struct OceanCache *UNUSED(och), struct OceanResult *UNUSED(ocr), int UNUSED(f),
+                             float UNUSED(u), float UNUSED(v))
 {
 }
 
-void BKE_ocean_cache_eval_ij(struct OceanCache *UNUSED(och), struct OceanResult *UNUSED(ocr), int UNUSED(f), int UNUSED(i), int UNUSED(j))
+void BKE_ocean_cache_eval_ij(struct OceanCache *UNUSED(och), struct OceanResult *UNUSED(ocr), int UNUSED(f),
+                             int UNUSED(i), int UNUSED(j))
 {
 }
 
-OceanCache *BKE_init_ocean_cache(const char *UNUSED(bakepath), const char *UNUSED(relbase),
-                                        int UNUSED(start), int UNUSED(end), float UNUSED(wave_scale),
-                                        float UNUSED(chop_amount), float UNUSED(foam_coverage), float UNUSED(foam_fade), int UNUSED(resolution))
+OceanCache *BKE_ocean_init_cache(const char *UNUSED(bakepath), const char *UNUSED(relbase), int UNUSED(start),
+                                 int UNUSED(end), float UNUSED(wave_scale), float UNUSED(chop_amount),
+                                 float UNUSED(foam_coverage), float UNUSED(foam_fade), int UNUSED(resolution))
 {
        OceanCache *och = MEM_callocN(sizeof(OceanCache), "ocean cache data");
 
        return och;
 }
 
-void BKE_simulate_ocean_cache(struct OceanCache *UNUSED(och), int UNUSED(frame))
+void BKE_ocean_simulate_cache(struct OceanCache *UNUSED(och), int UNUSED(frame))
 {
 }
 
-void BKE_bake_ocean(struct Ocean *UNUSED(o), struct OceanCache *UNUSED(och), void (*update_cb)(void *, float progress, int *cancel), void *UNUSED(update_cb_data))
+void BKE_ocean_bake(struct Ocean *UNUSED(o), struct OceanCache *UNUSED(och),
+                    void (*update_cb)(void *, float progress, int *cancel), void *UNUSED(update_cb_data))
 {
        /* unused */
        (void)update_cb;
 }
-#endif // WITH_OCEANSIM
+#endif /* WITH_OCEANSIM */