This version now includes the fluid control sources, however the Blender
[blender.git] / intern / elbeem / intern / solver_relax.h
1 /******************************************************************************
2  *
3  * El'Beem - the visual lattice boltzmann freesurface simulator
4  * All code distributed as part of El'Beem is covered by the version 2 of the 
5  * GNU General Public License. See the file COPYING for details.
6  * Copyright 2003-2006 Nils Thuerey
7  *
8  * Combined 2D/3D Lattice Boltzmann relaxation macros
9  *
10  *****************************************************************************/
11
12 #if FSGR_STRICT_DEBUG==1
13 #define CAUSE_PANIC { this->mPanic=1; /* *((int*)(0x0)) = 1; crash*/ }
14 #else // FSGR_STRICT_DEBUG==1
15 #define CAUSE_PANIC { this->mPanic=1; } /*set flag*/
16 #endif // FSGR_STRICT_DEBUG==1
17
18 // #if LBM_INCLUDE_TESTSOLVERS!=1
19 #if LBM_INCLUDE_CONTROL!=1
20
21 #define PRECOLLIDE_MODS(rho,ux,uy,uz, grav) \
22         ux += (grav)[0]; \
23         uy += (grav)[1]; \
24         uz += (grav)[2]; 
25
26 #define TEST_IF_CHECK 
27
28 #else // LBM_INCLUDE_CONTROL!=1
29 // defined in solver_control.h 
30 #endif // LBM_INCLUDE_CONTROL!=1
31
32         
33 /******************************************************************************
34  * normal relaxation
35  *****************************************************************************/
36
37 // standard arrays
38 #define CSRC_C    RAC(ccel                                , dC )
39 #define CSRC_E    RAC(ccel + (-1)             *(dTotalNum), dE )
40 #define CSRC_W    RAC(ccel + (+1)             *(dTotalNum), dW )
41 #define CSRC_N    RAC(ccel + (-mLevel[lev].lOffsx)        *(dTotalNum), dN )
42 #define CSRC_S    RAC(ccel + (+mLevel[lev].lOffsx)        *(dTotalNum), dS )
43 #define CSRC_NE   RAC(ccel + (-mLevel[lev].lOffsx-1)      *(dTotalNum), dNE)
44 #define CSRC_NW   RAC(ccel + (-mLevel[lev].lOffsx+1)      *(dTotalNum), dNW)
45 #define CSRC_SE   RAC(ccel + (+mLevel[lev].lOffsx-1)      *(dTotalNum), dSE)
46 #define CSRC_SW   RAC(ccel + (+mLevel[lev].lOffsx+1)      *(dTotalNum), dSW)
47 #define CSRC_T    RAC(ccel + (-mLevel[lev].lOffsy)        *(dTotalNum), dT )
48 #define CSRC_B    RAC(ccel + (+mLevel[lev].lOffsy)        *(dTotalNum), dB )
49 #define CSRC_ET   RAC(ccel + (-mLevel[lev].lOffsy-1)      *(dTotalNum), dET)
50 #define CSRC_EB   RAC(ccel + (+mLevel[lev].lOffsy-1)      *(dTotalNum), dEB)
51 #define CSRC_WT   RAC(ccel + (-mLevel[lev].lOffsy+1)      *(dTotalNum), dWT)
52 #define CSRC_WB   RAC(ccel + (+mLevel[lev].lOffsy+1)      *(dTotalNum), dWB)
53 #define CSRC_NT   RAC(ccel + (-mLevel[lev].lOffsy-mLevel[lev].lOffsx) *(dTotalNum), dNT)
54 #define CSRC_NB   RAC(ccel + (+mLevel[lev].lOffsy-mLevel[lev].lOffsx) *(dTotalNum), dNB)
55 #define CSRC_ST   RAC(ccel + (-mLevel[lev].lOffsy+mLevel[lev].lOffsx) *(dTotalNum), dST)
56 #define CSRC_SB   RAC(ccel + (+mLevel[lev].lOffsy+mLevel[lev].lOffsx) *(dTotalNum), dSB)
57
58 #define XSRC_C(x)    RAC(ccel + (x)                 *dTotalNum, dC )
59 #define XSRC_E(x)    RAC(ccel + ((x)-1)             *dTotalNum, dE )
60 #define XSRC_W(x)    RAC(ccel + ((x)+1)             *dTotalNum, dW )
61 #define XSRC_N(x)    RAC(ccel + ((x)-mLevel[lev].lOffsx)        *dTotalNum, dN )
62 #define XSRC_S(x)    RAC(ccel + ((x)+mLevel[lev].lOffsx)        *dTotalNum, dS )
63 #define XSRC_NE(x)   RAC(ccel + ((x)-mLevel[lev].lOffsx-1)      *dTotalNum, dNE)
64 #define XSRC_NW(x)   RAC(ccel + ((x)-mLevel[lev].lOffsx+1)      *dTotalNum, dNW)
65 #define XSRC_SE(x)   RAC(ccel + ((x)+mLevel[lev].lOffsx-1)      *dTotalNum, dSE)
66 #define XSRC_SW(x)   RAC(ccel + ((x)+mLevel[lev].lOffsx+1)      *dTotalNum, dSW)
67 #define XSRC_T(x)    RAC(ccel + ((x)-mLevel[lev].lOffsy)        *dTotalNum, dT )
68 #define XSRC_B(x)    RAC(ccel + ((x)+mLevel[lev].lOffsy)        *dTotalNum, dB )
69 #define XSRC_ET(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy-1)      *dTotalNum, dET)
70 #define XSRC_EB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy-1)      *dTotalNum, dEB)
71 #define XSRC_WT(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy+1)      *dTotalNum, dWT)
72 #define XSRC_WB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy+1)      *dTotalNum, dWB)
73 #define XSRC_NT(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy-mLevel[lev].lOffsx) *dTotalNum, dNT)
74 #define XSRC_NB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy-mLevel[lev].lOffsx) *dTotalNum, dNB)
75 #define XSRC_ST(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy+mLevel[lev].lOffsx) *dTotalNum, dST)
76 #define XSRC_SB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy+mLevel[lev].lOffsx) *dTotalNum, dSB)
77
78
79
80 #define OMEGA(l) mLevel[(l)].omega
81
82 #define EQC (  DFL1*(rho - usqr))
83 #define EQN (  DFL2*(rho + uy*(4.5*uy + 3.0) - usqr))
84 #define EQS (  DFL2*(rho + uy*(4.5*uy - 3.0) - usqr))
85 #define EQE (  DFL2*(rho + ux*(4.5*ux + 3.0) - usqr))
86 #define EQW (  DFL2*(rho + ux*(4.5*ux - 3.0) - usqr))
87 #define EQT (  DFL2*(rho + uz*(4.5*uz + 3.0) - usqr))
88 #define EQB (  DFL2*(rho + uz*(4.5*uz - 3.0) - usqr))
89                     
90 #define EQNE ( DFL3*(rho + (+ux+uy)*(4.5*(+ux+uy) + 3.0) - usqr))
91 #define EQNW ( DFL3*(rho + (-ux+uy)*(4.5*(-ux+uy) + 3.0) - usqr))
92 #define EQSE ( DFL3*(rho + (+ux-uy)*(4.5*(+ux-uy) + 3.0) - usqr))
93 #define EQSW ( DFL3*(rho + (-ux-uy)*(4.5*(-ux-uy) + 3.0) - usqr))
94 #define EQNT ( DFL3*(rho + (+uy+uz)*(4.5*(+uy+uz) + 3.0) - usqr))
95 #define EQNB ( DFL3*(rho + (+uy-uz)*(4.5*(+uy-uz) + 3.0) - usqr))
96 #define EQST ( DFL3*(rho + (-uy+uz)*(4.5*(-uy+uz) + 3.0) - usqr))
97 #define EQSB ( DFL3*(rho + (-uy-uz)*(4.5*(-uy-uz) + 3.0) - usqr))
98 #define EQET ( DFL3*(rho + (+ux+uz)*(4.5*(+ux+uz) + 3.0) - usqr))
99 #define EQEB ( DFL3*(rho + (+ux-uz)*(4.5*(+ux-uz) + 3.0) - usqr))
100 #define EQWT ( DFL3*(rho + (-ux+uz)*(4.5*(-ux+uz) + 3.0) - usqr))
101 #define EQWB ( DFL3*(rho + (-ux-uz)*(4.5*(-ux-uz) + 3.0) - usqr))
102
103
104 // this is a bit ugly, but necessary for the CSRC_ access...
105 #define MSRC_C    m[dC ]
106 #define MSRC_N    m[dN ]
107 #define MSRC_S    m[dS ]
108 #define MSRC_E    m[dE ]
109 #define MSRC_W    m[dW ]
110 #define MSRC_T    m[dT ]
111 #define MSRC_B    m[dB ]
112 #define MSRC_NE   m[dNE]
113 #define MSRC_NW   m[dNW]
114 #define MSRC_SE   m[dSE]
115 #define MSRC_SW   m[dSW]
116 #define MSRC_NT   m[dNT]
117 #define MSRC_NB   m[dNB]
118 #define MSRC_ST   m[dST]
119 #define MSRC_SB   m[dSB]
120 #define MSRC_ET   m[dET]
121 #define MSRC_EB   m[dEB]
122 #define MSRC_WT   m[dWT]
123 #define MSRC_WB   m[dWB]
124
125 // this is a bit ugly, but necessary for the ccel local access...
126 #define CCEL_C    RAC(ccel, dC )
127 #define CCEL_N    RAC(ccel, dN )
128 #define CCEL_S    RAC(ccel, dS )
129 #define CCEL_E    RAC(ccel, dE )
130 #define CCEL_W    RAC(ccel, dW )
131 #define CCEL_T    RAC(ccel, dT )
132 #define CCEL_B    RAC(ccel, dB )
133 #define CCEL_NE   RAC(ccel, dNE)
134 #define CCEL_NW   RAC(ccel, dNW)
135 #define CCEL_SE   RAC(ccel, dSE)
136 #define CCEL_SW   RAC(ccel, dSW)
137 #define CCEL_NT   RAC(ccel, dNT)
138 #define CCEL_NB   RAC(ccel, dNB)
139 #define CCEL_ST   RAC(ccel, dST)
140 #define CCEL_SB   RAC(ccel, dSB)
141 #define CCEL_ET   RAC(ccel, dET)
142 #define CCEL_EB   RAC(ccel, dEB)
143 #define CCEL_WT   RAC(ccel, dWT)
144 #define CCEL_WB   RAC(ccel, dWB)
145 // for coarse to fine interpol access
146 #define CCELG_C(f)    (RAC(ccel, dC )*mGaussw[(f)])
147 #define CCELG_N(f)    (RAC(ccel, dN )*mGaussw[(f)])
148 #define CCELG_S(f)    (RAC(ccel, dS )*mGaussw[(f)])
149 #define CCELG_E(f)    (RAC(ccel, dE )*mGaussw[(f)])
150 #define CCELG_W(f)    (RAC(ccel, dW )*mGaussw[(f)])
151 #define CCELG_T(f)    (RAC(ccel, dT )*mGaussw[(f)])
152 #define CCELG_B(f)    (RAC(ccel, dB )*mGaussw[(f)])
153 #define CCELG_NE(f)   (RAC(ccel, dNE)*mGaussw[(f)])
154 #define CCELG_NW(f)   (RAC(ccel, dNW)*mGaussw[(f)])
155 #define CCELG_SE(f)   (RAC(ccel, dSE)*mGaussw[(f)])
156 #define CCELG_SW(f)   (RAC(ccel, dSW)*mGaussw[(f)])
157 #define CCELG_NT(f)   (RAC(ccel, dNT)*mGaussw[(f)])
158 #define CCELG_NB(f)   (RAC(ccel, dNB)*mGaussw[(f)])
159 #define CCELG_ST(f)   (RAC(ccel, dST)*mGaussw[(f)])
160 #define CCELG_SB(f)   (RAC(ccel, dSB)*mGaussw[(f)])
161 #define CCELG_ET(f)   (RAC(ccel, dET)*mGaussw[(f)])
162 #define CCELG_EB(f)   (RAC(ccel, dEB)*mGaussw[(f)])
163 #define CCELG_WT(f)   (RAC(ccel, dWT)*mGaussw[(f)])
164 #define CCELG_WB(f)   (RAC(ccel, dWB)*mGaussw[(f)])
165
166
167 #if PARALLEL==1
168 #define CSMOMEGA_STATS(dlev, domega) 
169 #else // PARALLEL==1
170 #if FSGR_OMEGA_DEBUG==1
171 #define CSMOMEGA_STATS(dlev, domega) \
172         mLevel[dlev].avgOmega += domega; mLevel[dlev].avgOmegaCnt+=1.0; 
173 #else // FSGR_OMEGA_DEBUG==1
174 #define CSMOMEGA_STATS(dlev, domega) 
175 #endif // FSGR_OMEGA_DEBUG==1
176 #endif // PARALLEL==1
177
178
179 // used for main loops and grav init
180 // source set
181 #define SRCS(l) mLevel[(l)].setCurr
182 // target set
183 #define TSET(l) mLevel[(l)].setOther
184
185 // handle mov. obj 
186 #if FSGR_STRICT_DEBUG==1
187
188 #define  LBMDS_ADDMOV(linv,l)  \
189          \
190         if((nbflag[linv]&CFBndMoving)&&(!(nbflag[l]&CFBnd))){ \
191          \
192         LbmFloat dte=QCELL_NBINV(lev, i, j, k, SRCS(lev), l,dFlux)-(mSimulationTime+this->mpParam->getTimestep()); \
193         if( ABS(dte)< 1e-15 ) { \
194         m[l]+=QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l); \
195         } else { \
196         const int sdx = i+this->dfVecX[linv], sdy = j+this->dfVecY[linv], sdz = k+this->dfVecZ[linv]; \
197          \
198         errMsg("INVALID_MOV_OBJ_TIME"," at "<<PRINT_IJK<<" from l"<<l<<" "<<PRINT_VEC(sdx,sdy,sdz)<<" t="<<(mSimulationTime+this->mpParam->getTimestep())<<" ct="<<QCELL_NBINV(lev, i, j, k, SRCS(lev), l,dFlux)<<" dte="<<dte); \
199         debugMarkCell(lev,sdx,sdy,sdz); \
200         } \
201         } \
202
203
204
205 #else // FSGR_STRICT_DEBUG==1
206
207 #define  LBMDS_ADDMOV(linv,l)  \
208          \
209          \
210         if((nbflag[linv]&CFBndMoving)&&(!(nbflag[l]&CFBnd))){ \
211          \
212         m[l]+=QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l); \
213         } \
214
215
216
217 #endif // !FSGR_STRICT_DEBUG==1
218
219 // treatment of freeslip reflection
220 // used both for OPT and nonOPT
221 #define  DEFAULT_STREAM_FREESLIP(l,invl,mnbf)  \
222          \
223         int nb1 = 0, nb2 = 0; \
224         LbmFloat newval = 0.0; \
225         const int dx = this->dfVecX[invl], dy = this->dfVecY[invl], dz = this->dfVecZ[invl]; \
226          \
227          \
228          \
229         const LbmFloat movadd = ( \
230         ((nbflag[invl]&CFBndMoving)&&(!(nbflag[l]&CFBnd))) ? \
231         (QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l)) : 0.); \
232          \
233         if(dz==0) { \
234         nb1 = !(RFLAG(lev, i,   j+dy,k, SRCS(lev))&(CFFluid|CFInter)); \
235         nb2 = !(RFLAG(lev, i+dx,j,   k, SRCS(lev))&(CFFluid|CFInter)); \
236         if((nb1)&&(!nb2)) { \
237          \
238         newval = QCELL(lev, i+dx,j,k,SRCS(lev), this->dfRefX[l]); \
239         } else \
240         if((!nb1)&&(nb2)) { \
241          \
242         newval = QCELL(lev, i,j+dy,k,SRCS(lev), this->dfRefY[l]); \
243         } else { \
244          \
245         newval = RAC(ccel, this->dfInv[l] ) +movadd /* */; \
246         } \
247         } else \
248         if(dy==0) { \
249         nb1 = !(RFLAG(lev, i,j,k+dz, SRCS(lev))&(CFFluid|CFInter)); \
250         nb2 = !(RFLAG(lev, i+dx,j,k, SRCS(lev))&(CFFluid|CFInter)); \
251         if((nb1)&&(!nb2)) { \
252          \
253         newval = QCELL(lev, i+dx,j,k,SRCS(lev), this->dfRefX[l]); \
254         } else \
255         if((!nb1)&&(nb2)) { \
256          \
257         newval = QCELL(lev, i,j,k+dz,SRCS(lev), this->dfRefZ[l]); \
258         } else { \
259          \
260         newval = RAC(ccel, this->dfInv[l] )  +movadd /* */; \
261         } \
262          \
263         } else \
264          \
265         { \
266          \
267         nb1 = !(RFLAG(lev, i,j,k+dz, SRCS(lev))&(CFFluid|CFInter)); \
268         nb2 = !(RFLAG(lev, i,j+dy,k, SRCS(lev))&(CFFluid|CFInter)); \
269         if((nb1)&&(!nb2)) { \
270          \
271         newval = QCELL(lev, i,j+dy,k,SRCS(lev), this->dfRefY[l]); \
272         } else \
273         if((!nb1)&&(nb2)) { \
274          \
275         newval = QCELL(lev, i,j,k+dz,SRCS(lev), this->dfRefZ[l]); \
276         } else { \
277          \
278         newval = RAC(ccel, this->dfInv[l] )  +movadd /* */; \
279         } \
280         } \
281          \
282         if(mnbf & CFBndPartslip) { \
283         const LbmFloat partv = mObjectPartslips[(int)(mnbf>>24)]; \
284          \
285         m[l] = (RAC(ccel, this->dfInv[l] )  +movadd /* d *(1./1.) */ ) * partv + newval * (1.0-partv); \
286         } else { \
287         m[l] = newval; \
288         } \
289          \
290
291
292
293
294 // complete default stream&collide, 2d/3d
295 /* read distribution funtions of adjacent cells = sweep step */ 
296 #if OPT3D==0 
297
298 #if FSGR_STRICT_DEBUG==1
299 #define MARKCELLCHECK \
300         debugMarkCell(lev,i,j,k); CAUSE_PANIC;
301 #define STREAMCHECK(id,ni,nj,nk,nl) \
302         if((!(m[nl] > -1.0) && (m[nl]<1.0)) ) {\
303                 errMsg("STREAMCHECK","ID"<<id<<" Invalid streamed DF nl"<<nl<<" value:"<<m[nl]<<" at "<<PRINT_IJK<<" from "<<PRINT_VEC(ni,nj,nk)<<" nl"<<(nl)<<\
304                                 " nfc"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setCurr)<<" nfo"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setOther)  ); \
305                 /*FORDF0{ errMsg("STREAMCHECK"," at "<<PRINT_IJK<<" df "<<l<<"="<<m[l] ); } */ \
306                 MARKCELLCHECK; \
307                 m[nl] = dfEquil[nl]; /* REPAIR */ \
308         }
309 #define COLLCHECK \
310         if( (rho>2.0) || (rho<-1.0) || (ABS(ux)>1.0) || (ABS(uy)>1.0) |(ABS(uz)>1.0) ) {\
311                 errMsg("COLLCHECK","Invalid collision values r:"<<rho<<" u:"PRINT_VEC(ux,uy,uz)<<" at? "<<PRINT_IJK ); \
312                 /*FORDF0{ errMsg("COLLCHECK"," at? "<<PRINT_IJK<<" df "<<l<<"="<<m[l] ); }*/ \
313                 rho=ux=uy=uz= 0.; /* REPAIR */ \
314                 MARKCELLCHECK; \
315         }
316 #else
317 #define STREAMCHECK(id, ni,nj,nk,nl) 
318 #define COLLCHECK
319 #endif
320
321 // careful ux,uy,uz need to be inited before!
322 #define  DEFAULT_STREAM  \
323         m[dC] = RAC(ccel,dC); \
324         STREAMCHECK(1, i,j,k, dC); \
325         FORDF1 { \
326         CellFlagType nbf = nbflag[ this->dfInv[l] ]; \
327         if(nbf & CFBnd) { \
328         if(nbf & CFBndNoslip) { \
329          \
330         m[l] = RAC(ccel, this->dfInv[l] ); \
331         LBMDS_ADDMOV(this->dfInv[l],l); \
332         STREAMCHECK(2, i,j,k, l); \
333         } else if(nbf & (CFBndFreeslip|CFBndPartslip)) { \
334          \
335         if(l<=LBMDIM*2) { \
336         m[l] = RAC(ccel, this->dfInv[l] ); STREAMCHECK(3, i,j,k, l); \
337         LBMDS_ADDMOV(this->dfInv[l],l); \
338         } else { \
339         const int inv_l = this->dfInv[l]; \
340         DEFAULT_STREAM_FREESLIP(l,inv_l,nbf); \
341         } \
342          \
343         } \
344         else { \
345         errMsg("LbmFsgrSolver","Invalid Bnd type at "<<PRINT_IJK<<" f"<<convertCellFlagType2String(nbf)<<",nbdir"<<this->dfInv[l] ); \
346         } \
347         } else { \
348         m[l] = QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l); \
349         if(RFLAG(lev, i,j,k, mLevel[lev].setCurr)&CFFluid) { \
350         if(!(nbf&(CFFluid|CFInter)) ) { \
351         int ni=i+this->dfVecX[this->dfInv[l]], nj=j+this->dfVecY[this->dfInv[l]], nk=k+this->dfVecZ[this->dfInv[l]]; \
352         errMsg("STREAMCHECK"," Invalid nbflag, streamed DF l"<<l<<" value:"<<m[l]<<" at "<<PRINT_IJK<<" from "<< \
353         PRINT_VEC(ni,nj,nk) <<" l"<<(l)<< \
354         " nfc"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setCurr)<<" nfo"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setOther)  ); \
355          \
356          \
357         } } \
358         STREAMCHECK(4, i+this->dfVecX[this->dfInv[l]], j+this->dfVecY[this->dfInv[l]],k+this->dfVecZ[this->dfInv[l]], l); \
359         } \
360         } \
361
362
363
364
365 // careful ux,uy,uz need to be inited before!
366 #define  DEFAULT_COLLIDEG(grav)  \
367         this->collideArrays(lev, i,j,k, m, rho,ux,uy,uz, OMEGA(lev), grav, mLevel[lev].lcsmago, &mDebugOmegaRet, &lcsmqo ); \
368         CSMOMEGA_STATS(lev,mDebugOmegaRet); \
369         FORDF0 { RAC(tcel,l) = m[l]; } \
370         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
371         COLLCHECK; \
372
373
374
375 #define  OPTIMIZED_STREAMCOLLIDE  \
376         m[0] = RAC(ccel,0); \
377         FORDF1 { \
378          \
379         if(RFLAG_NBINV(lev, i,j,k,SRCS(lev),l)&CFBnd) { errMsg("???", "bnd-err-nobndfl"); CAUSE_PANIC; \
380         } else { m[l] = QCELL_NBINV(lev, i, j, k, SRCS(lev), l, l); } \
381         STREAMCHECK(8, i+this->dfVecX[this->dfInv[l]], j+this->dfVecY[this->dfInv[l]],k+this->dfVecZ[this->dfInv[l]], l); \
382         } \
383         rho=m[0]; \
384         DEFAULT_COLLIDEG(mLevel[lev].gravity) \
385
386
387
388 #define  OPTIMIZED_STREAMCOLLIDE___UNUSED  \
389          \
390         this->collideArrays(lev, i,j,k, m, rho,ux,uy,uz, OMEGA(lev), mLevel[lev].gravity, mLevel[lev].lcsmago , &mDebugOmegaRet, &lcsmqo   ); \
391         CSMOMEGA_STATS(lev,mDebugOmegaRet); \
392         FORDF0 { RAC(tcel,l) = m[l]; } \
393         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
394         COLLCHECK; \
395
396
397
398 #else  // 3D, opt OPT3D==true
399
400
401 // default stream opt3d add moving bc val
402 #define  DEFAULT_STREAM  \
403         m[dC] = RAC(ccel,dC); \
404          \
405         if((!nbored & CFBnd)) { \
406          \
407         m[dN ] = CSRC_N ; m[dS ] = CSRC_S ; \
408         m[dE ] = CSRC_E ; m[dW ] = CSRC_W ; \
409         m[dT ] = CSRC_T ; m[dB ] = CSRC_B ; \
410         m[dNE] = CSRC_NE; m[dNW] = CSRC_NW; m[dSE] = CSRC_SE; m[dSW] = CSRC_SW; \
411         m[dNT] = CSRC_NT; m[dNB] = CSRC_NB; m[dST] = CSRC_ST; m[dSB] = CSRC_SB; \
412         m[dET] = CSRC_ET; m[dEB] = CSRC_EB; m[dWT] = CSRC_WT; m[dWB] = CSRC_WB; \
413         } else { \
414          \
415         if(nbflag[dS ]&CFBnd) { m[dN ] = RAC(ccel,dS ); LBMDS_ADDMOV(dS ,dN ); } else { m[dN ] = CSRC_N ; } \
416         if(nbflag[dN ]&CFBnd) { m[dS ] = RAC(ccel,dN ); LBMDS_ADDMOV(dN ,dS ); } else { m[dS ] = CSRC_S ; } \
417         if(nbflag[dW ]&CFBnd) { m[dE ] = RAC(ccel,dW ); LBMDS_ADDMOV(dW ,dE ); } else { m[dE ] = CSRC_E ; } \
418         if(nbflag[dE ]&CFBnd) { m[dW ] = RAC(ccel,dE ); LBMDS_ADDMOV(dE ,dW ); } else { m[dW ] = CSRC_W ; } \
419         if(nbflag[dB ]&CFBnd) { m[dT ] = RAC(ccel,dB ); LBMDS_ADDMOV(dB ,dT ); } else { m[dT ] = CSRC_T ; } \
420         if(nbflag[dT ]&CFBnd) { m[dB ] = RAC(ccel,dT ); LBMDS_ADDMOV(dT ,dB ); } else { m[dB ] = CSRC_B ; } \
421          \
422          \
423         if(nbflag[dSW]&CFBnd) { if(nbflag[dSW]&CFBndNoslip){ m[dNE] = RAC(ccel,dSW); LBMDS_ADDMOV(dSW,dNE); }else{ DEFAULT_STREAM_FREESLIP(dNE,dSW,nbflag[dSW]);} } else { m[dNE] = CSRC_NE; } \
424         if(nbflag[dSE]&CFBnd) { if(nbflag[dSE]&CFBndNoslip){ m[dNW] = RAC(ccel,dSE); LBMDS_ADDMOV(dSE,dNW); }else{ DEFAULT_STREAM_FREESLIP(dNW,dSE,nbflag[dSE]);} } else { m[dNW] = CSRC_NW; } \
425         if(nbflag[dNW]&CFBnd) { if(nbflag[dNW]&CFBndNoslip){ m[dSE] = RAC(ccel,dNW); LBMDS_ADDMOV(dNW,dSE); }else{ DEFAULT_STREAM_FREESLIP(dSE,dNW,nbflag[dNW]);} } else { m[dSE] = CSRC_SE; } \
426         if(nbflag[dNE]&CFBnd) { if(nbflag[dNE]&CFBndNoslip){ m[dSW] = RAC(ccel,dNE); LBMDS_ADDMOV(dNE,dSW); }else{ DEFAULT_STREAM_FREESLIP(dSW,dNE,nbflag[dNE]);} } else { m[dSW] = CSRC_SW; } \
427         if(nbflag[dSB]&CFBnd) { if(nbflag[dSB]&CFBndNoslip){ m[dNT] = RAC(ccel,dSB); LBMDS_ADDMOV(dSB,dNT); }else{ DEFAULT_STREAM_FREESLIP(dNT,dSB,nbflag[dSB]);} } else { m[dNT] = CSRC_NT; } \
428         if(nbflag[dST]&CFBnd) { if(nbflag[dST]&CFBndNoslip){ m[dNB] = RAC(ccel,dST); LBMDS_ADDMOV(dST,dNB); }else{ DEFAULT_STREAM_FREESLIP(dNB,dST,nbflag[dST]);} } else { m[dNB] = CSRC_NB; } \
429         if(nbflag[dNB]&CFBnd) { if(nbflag[dNB]&CFBndNoslip){ m[dST] = RAC(ccel,dNB); LBMDS_ADDMOV(dNB,dST); }else{ DEFAULT_STREAM_FREESLIP(dST,dNB,nbflag[dNB]);} } else { m[dST] = CSRC_ST; } \
430         if(nbflag[dNT]&CFBnd) { if(nbflag[dNT]&CFBndNoslip){ m[dSB] = RAC(ccel,dNT); LBMDS_ADDMOV(dNT,dSB); }else{ DEFAULT_STREAM_FREESLIP(dSB,dNT,nbflag[dNT]);} } else { m[dSB] = CSRC_SB; } \
431         if(nbflag[dWB]&CFBnd) { if(nbflag[dWB]&CFBndNoslip){ m[dET] = RAC(ccel,dWB); LBMDS_ADDMOV(dWB,dET); }else{ DEFAULT_STREAM_FREESLIP(dET,dWB,nbflag[dWB]);} } else { m[dET] = CSRC_ET; } \
432         if(nbflag[dWT]&CFBnd) { if(nbflag[dWT]&CFBndNoslip){ m[dEB] = RAC(ccel,dWT); LBMDS_ADDMOV(dWT,dEB); }else{ DEFAULT_STREAM_FREESLIP(dEB,dWT,nbflag[dWT]);} } else { m[dEB] = CSRC_EB; } \
433         if(nbflag[dEB]&CFBnd) { if(nbflag[dEB]&CFBndNoslip){ m[dWT] = RAC(ccel,dEB); LBMDS_ADDMOV(dEB,dWT); }else{ DEFAULT_STREAM_FREESLIP(dWT,dEB,nbflag[dEB]);} } else { m[dWT] = CSRC_WT; } \
434         if(nbflag[dET]&CFBnd) { if(nbflag[dET]&CFBndNoslip){ m[dWB] = RAC(ccel,dET); LBMDS_ADDMOV(dET,dWB); }else{ DEFAULT_STREAM_FREESLIP(dWB,dET,nbflag[dET]);} } else { m[dWB] = CSRC_WB; } \
435         } \
436
437
438
439
440
441 #define  COLL_CALCULATE_DFEQ(dstarray)  \
442         dstarray[dN ] = EQN ; dstarray[dS ] = EQS ; \
443         dstarray[dE ] = EQE ; dstarray[dW ] = EQW ; \
444         dstarray[dT ] = EQT ; dstarray[dB ] = EQB ; \
445         dstarray[dNE] = EQNE; dstarray[dNW] = EQNW; dstarray[dSE] = EQSE; dstarray[dSW] = EQSW; \
446         dstarray[dNT] = EQNT; dstarray[dNB] = EQNB; dstarray[dST] = EQST; dstarray[dSB] = EQSB; \
447         dstarray[dET] = EQET; dstarray[dEB] = EQEB; dstarray[dWT] = EQWT; dstarray[dWB] = EQWB; \
448
449
450
451 #define  COLL_CALCULATE_NONEQTENSOR(csolev, srcArray )  \
452         lcsmqadd  = (srcArray##NE - lcsmeq[ dNE ]); \
453         lcsmqadd -= (srcArray##NW - lcsmeq[ dNW ]); \
454         lcsmqadd -= (srcArray##SE - lcsmeq[ dSE ]); \
455         lcsmqadd += (srcArray##SW - lcsmeq[ dSW ]); \
456         lcsmqo = (lcsmqadd*    lcsmqadd); \
457         lcsmqadd  = (srcArray##ET - lcsmeq[  dET ]); \
458         lcsmqadd -= (srcArray##EB - lcsmeq[  dEB ]); \
459         lcsmqadd -= (srcArray##WT - lcsmeq[  dWT ]); \
460         lcsmqadd += (srcArray##WB - lcsmeq[  dWB ]); \
461         lcsmqo += (lcsmqadd*    lcsmqadd); \
462         lcsmqadd  = (srcArray##NT - lcsmeq[  dNT ]); \
463         lcsmqadd -= (srcArray##NB - lcsmeq[  dNB ]); \
464         lcsmqadd -= (srcArray##ST - lcsmeq[  dST ]); \
465         lcsmqadd += (srcArray##SB - lcsmeq[  dSB ]); \
466         lcsmqo += (lcsmqadd*    lcsmqadd); \
467         lcsmqo *= 2.0; \
468         lcsmqadd  = (srcArray##E  -  lcsmeq[ dE  ]); \
469         lcsmqadd += (srcArray##W  -  lcsmeq[ dW  ]); \
470         lcsmqadd += (srcArray##NE -  lcsmeq[ dNE ]); \
471         lcsmqadd += (srcArray##NW -  lcsmeq[ dNW ]); \
472         lcsmqadd += (srcArray##SE -  lcsmeq[ dSE ]); \
473         lcsmqadd += (srcArray##SW -  lcsmeq[ dSW ]); \
474         lcsmqadd += (srcArray##ET  - lcsmeq[ dET ]); \
475         lcsmqadd += (srcArray##EB  - lcsmeq[ dEB ]); \
476         lcsmqadd += (srcArray##WT  - lcsmeq[ dWT ]); \
477         lcsmqadd += (srcArray##WB  - lcsmeq[ dWB ]); \
478         lcsmqo += (lcsmqadd*    lcsmqadd); \
479         lcsmqadd  = (srcArray##N  -  lcsmeq[ dN  ]); \
480         lcsmqadd += (srcArray##S  -  lcsmeq[ dS  ]); \
481         lcsmqadd += (srcArray##NE -  lcsmeq[ dNE ]); \
482         lcsmqadd += (srcArray##NW -  lcsmeq[ dNW ]); \
483         lcsmqadd += (srcArray##SE -  lcsmeq[ dSE ]); \
484         lcsmqadd += (srcArray##SW -  lcsmeq[ dSW ]); \
485         lcsmqadd += (srcArray##NT  - lcsmeq[ dNT ]); \
486         lcsmqadd += (srcArray##NB  - lcsmeq[ dNB ]); \
487         lcsmqadd += (srcArray##ST  - lcsmeq[ dST ]); \
488         lcsmqadd += (srcArray##SB  - lcsmeq[ dSB ]); \
489         lcsmqo += (lcsmqadd*    lcsmqadd); \
490         lcsmqadd  = (srcArray##T  -  lcsmeq[ dT  ]); \
491         lcsmqadd += (srcArray##B  -  lcsmeq[ dB  ]); \
492         lcsmqadd += (srcArray##NT -  lcsmeq[ dNT ]); \
493         lcsmqadd += (srcArray##NB -  lcsmeq[ dNB ]); \
494         lcsmqadd += (srcArray##ST -  lcsmeq[ dST ]); \
495         lcsmqadd += (srcArray##SB -  lcsmeq[ dSB ]); \
496         lcsmqadd += (srcArray##ET  - lcsmeq[ dET ]); \
497         lcsmqadd += (srcArray##EB  - lcsmeq[ dEB ]); \
498         lcsmqadd += (srcArray##WT  - lcsmeq[ dWT ]); \
499         lcsmqadd += (srcArray##WB  - lcsmeq[ dWB ]); \
500         lcsmqo += (lcsmqadd*    lcsmqadd); \
501         lcsmqo = sqrt(lcsmqo); \
502
503
504
505 //                      COLL_CALCULATE_CSMOMEGAVAL(csolev, lcsmomega); 
506
507 // careful - need lcsmqo 
508 #define  COLL_CALCULATE_CSMOMEGAVAL(csolev, dstomega )  \
509         dstomega =  1.0/ \
510         ( 3.0*( mLevel[(csolev)].lcnu+mLevel[(csolev)].lcsmago_sqr*( \
511         -mLevel[(csolev)].lcnu + sqrt( mLevel[(csolev)].lcnu*mLevel[(csolev)].lcnu + 18.0*mLevel[(csolev)].lcsmago_sqr* lcsmqo ) \
512         / (6.0*mLevel[(csolev)].lcsmago_sqr)) \
513         ) +0.5 ); \
514
515
516
517 #define  DEFAULT_COLLIDE_LES(grav)  \
518         rho = + MSRC_C  + MSRC_N \
519         + MSRC_S  + MSRC_E \
520         + MSRC_W  + MSRC_T \
521         + MSRC_B  + MSRC_NE \
522         + MSRC_NW + MSRC_SE \
523         + MSRC_SW + MSRC_NT \
524         + MSRC_NB + MSRC_ST \
525         + MSRC_SB + MSRC_ET \
526         + MSRC_EB + MSRC_WT \
527         + MSRC_WB; \
528          \
529         ux = MSRC_E - MSRC_W \
530         + MSRC_NE - MSRC_NW \
531         + MSRC_SE - MSRC_SW \
532         + MSRC_ET + MSRC_EB \
533         - MSRC_WT - MSRC_WB ; \
534          \
535         uy = MSRC_N - MSRC_S \
536         + MSRC_NE + MSRC_NW \
537         - MSRC_SE - MSRC_SW \
538         + MSRC_NT + MSRC_NB \
539         - MSRC_ST - MSRC_SB ; \
540          \
541         uz = MSRC_T - MSRC_B \
542         + MSRC_NT - MSRC_NB \
543         + MSRC_ST - MSRC_SB \
544         + MSRC_ET - MSRC_EB \
545         + MSRC_WT - MSRC_WB ; \
546         PRECOLLIDE_MODS(rho,ux,uy,uz, grav); \
547         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
548         COLL_CALCULATE_DFEQ(lcsmeq); \
549         COLL_CALCULATE_NONEQTENSOR(lev, MSRC_); \
550         COLL_CALCULATE_CSMOMEGAVAL(lev, lcsmomega); \
551         CSMOMEGA_STATS(lev,lcsmomega); \
552          \
553         RAC(tcel,dC ) = (1.0-lcsmomega)*MSRC_C  + lcsmomega*EQC ; \
554          \
555         RAC(tcel,dN ) = (1.0-lcsmomega)*MSRC_N  + lcsmomega*lcsmeq[ dN ]; \
556         RAC(tcel,dS ) = (1.0-lcsmomega)*MSRC_S  + lcsmomega*lcsmeq[ dS ]; \
557         RAC(tcel,dE ) = (1.0-lcsmomega)*MSRC_E  + lcsmomega*lcsmeq[ dE ]; \
558         RAC(tcel,dW ) = (1.0-lcsmomega)*MSRC_W  + lcsmomega*lcsmeq[ dW ]; \
559         RAC(tcel,dT ) = (1.0-lcsmomega)*MSRC_T  + lcsmomega*lcsmeq[ dT ]; \
560         RAC(tcel,dB ) = (1.0-lcsmomega)*MSRC_B  + lcsmomega*lcsmeq[ dB ]; \
561          \
562         RAC(tcel,dNE) = (1.0-lcsmomega)*MSRC_NE + lcsmomega*lcsmeq[ dNE]; \
563         RAC(tcel,dNW) = (1.0-lcsmomega)*MSRC_NW + lcsmomega*lcsmeq[ dNW]; \
564         RAC(tcel,dSE) = (1.0-lcsmomega)*MSRC_SE + lcsmomega*lcsmeq[ dSE]; \
565         RAC(tcel,dSW) = (1.0-lcsmomega)*MSRC_SW + lcsmomega*lcsmeq[ dSW]; \
566         RAC(tcel,dNT) = (1.0-lcsmomega)*MSRC_NT + lcsmomega*lcsmeq[ dNT]; \
567         RAC(tcel,dNB) = (1.0-lcsmomega)*MSRC_NB + lcsmomega*lcsmeq[ dNB]; \
568         RAC(tcel,dST) = (1.0-lcsmomega)*MSRC_ST + lcsmomega*lcsmeq[ dST]; \
569         RAC(tcel,dSB) = (1.0-lcsmomega)*MSRC_SB + lcsmomega*lcsmeq[ dSB]; \
570         RAC(tcel,dET) = (1.0-lcsmomega)*MSRC_ET + lcsmomega*lcsmeq[ dET]; \
571         RAC(tcel,dEB) = (1.0-lcsmomega)*MSRC_EB + lcsmomega*lcsmeq[ dEB]; \
572         RAC(tcel,dWT) = (1.0-lcsmomega)*MSRC_WT + lcsmomega*lcsmeq[ dWT]; \
573         RAC(tcel,dWB) = (1.0-lcsmomega)*MSRC_WB + lcsmomega*lcsmeq[ dWB]; \
574
575
576
577 #define  DEFAULT_COLLIDE_NOLES(grav)  \
578         rho = + MSRC_C  + MSRC_N \
579         + MSRC_S  + MSRC_E \
580         + MSRC_W  + MSRC_T \
581         + MSRC_B  + MSRC_NE \
582         + MSRC_NW + MSRC_SE \
583         + MSRC_SW + MSRC_NT \
584         + MSRC_NB + MSRC_ST \
585         + MSRC_SB + MSRC_ET \
586         + MSRC_EB + MSRC_WT \
587         + MSRC_WB; \
588          \
589         ux = MSRC_E - MSRC_W \
590         + MSRC_NE - MSRC_NW \
591         + MSRC_SE - MSRC_SW \
592         + MSRC_ET + MSRC_EB \
593         - MSRC_WT - MSRC_WB ; \
594          \
595         uy = MSRC_N - MSRC_S \
596         + MSRC_NE + MSRC_NW \
597         - MSRC_SE - MSRC_SW \
598         + MSRC_NT + MSRC_NB \
599         - MSRC_ST - MSRC_SB ; \
600          \
601         uz = MSRC_T - MSRC_B \
602         + MSRC_NT - MSRC_NB \
603         + MSRC_ST - MSRC_SB \
604         + MSRC_ET - MSRC_EB \
605         + MSRC_WT - MSRC_WB ; \
606         PRECOLLIDE_MODS(rho, ux,uy,uz, grav); \
607         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
608          \
609         RAC(tcel,dC ) = (1.0-OMEGA(lev))*MSRC_C  + OMEGA(lev)*EQC ; \
610          \
611         RAC(tcel,dN ) = (1.0-OMEGA(lev))*MSRC_N  + OMEGA(lev)*EQN ; \
612         RAC(tcel,dS ) = (1.0-OMEGA(lev))*MSRC_S  + OMEGA(lev)*EQS ; \
613         RAC(tcel,dE ) = (1.0-OMEGA(lev))*MSRC_E  + OMEGA(lev)*EQE ; \
614         RAC(tcel,dW ) = (1.0-OMEGA(lev))*MSRC_W  + OMEGA(lev)*EQW ; \
615         RAC(tcel,dT ) = (1.0-OMEGA(lev))*MSRC_T  + OMEGA(lev)*EQT ; \
616         RAC(tcel,dB ) = (1.0-OMEGA(lev))*MSRC_B  + OMEGA(lev)*EQB ; \
617          \
618         RAC(tcel,dNE) = (1.0-OMEGA(lev))*MSRC_NE + OMEGA(lev)*EQNE; \
619         RAC(tcel,dNW) = (1.0-OMEGA(lev))*MSRC_NW + OMEGA(lev)*EQNW; \
620         RAC(tcel,dSE) = (1.0-OMEGA(lev))*MSRC_SE + OMEGA(lev)*EQSE; \
621         RAC(tcel,dSW) = (1.0-OMEGA(lev))*MSRC_SW + OMEGA(lev)*EQSW; \
622         RAC(tcel,dNT) = (1.0-OMEGA(lev))*MSRC_NT + OMEGA(lev)*EQNT; \
623         RAC(tcel,dNB) = (1.0-OMEGA(lev))*MSRC_NB + OMEGA(lev)*EQNB; \
624         RAC(tcel,dST) = (1.0-OMEGA(lev))*MSRC_ST + OMEGA(lev)*EQST; \
625         RAC(tcel,dSB) = (1.0-OMEGA(lev))*MSRC_SB + OMEGA(lev)*EQSB; \
626         RAC(tcel,dET) = (1.0-OMEGA(lev))*MSRC_ET + OMEGA(lev)*EQET; \
627         RAC(tcel,dEB) = (1.0-OMEGA(lev))*MSRC_EB + OMEGA(lev)*EQEB; \
628         RAC(tcel,dWT) = (1.0-OMEGA(lev))*MSRC_WT + OMEGA(lev)*EQWT; \
629         RAC(tcel,dWB) = (1.0-OMEGA(lev))*MSRC_WB + OMEGA(lev)*EQWB; \
630
631
632
633
634
635 #define  OPTIMIZED_STREAMCOLLIDE_LES  \
636          \
637         m[dC ] = CSRC_C ; \
638         m[dN ] = CSRC_N ; m[dS ] = CSRC_S ; \
639         m[dE ] = CSRC_E ; m[dW ] = CSRC_W ; \
640         m[dT ] = CSRC_T ; m[dB ] = CSRC_B ; \
641         m[dNE] = CSRC_NE; m[dNW] = CSRC_NW; m[dSE] = CSRC_SE; m[dSW] = CSRC_SW; \
642         m[dNT] = CSRC_NT; m[dNB] = CSRC_NB; m[dST] = CSRC_ST; m[dSB] = CSRC_SB; \
643         m[dET] = CSRC_ET; m[dEB] = CSRC_EB; m[dWT] = CSRC_WT; m[dWB] = CSRC_WB; \
644          \
645         rho = MSRC_C  + MSRC_N + MSRC_S  + MSRC_E + MSRC_W  + MSRC_T \
646         + MSRC_B  + MSRC_NE + MSRC_NW + MSRC_SE + MSRC_SW + MSRC_NT \
647         + MSRC_NB + MSRC_ST + MSRC_SB + MSRC_ET + MSRC_EB + MSRC_WT + MSRC_WB; \
648         ux = MSRC_E - MSRC_W + MSRC_NE - MSRC_NW + MSRC_SE - MSRC_SW \
649         + MSRC_ET + MSRC_EB - MSRC_WT - MSRC_WB; \
650         uy = MSRC_N - MSRC_S + MSRC_NE + MSRC_NW - MSRC_SE - MSRC_SW \
651         + MSRC_NT + MSRC_NB - MSRC_ST - MSRC_SB; \
652         uz = MSRC_T - MSRC_B + MSRC_NT - MSRC_NB + MSRC_ST - MSRC_SB \
653         + MSRC_ET - MSRC_EB + MSRC_WT - MSRC_WB; \
654         PRECOLLIDE_MODS(rho, ux,uy,uz, mLevel[lev].gravity); \
655         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
656         COLL_CALCULATE_DFEQ(lcsmeq); \
657         COLL_CALCULATE_NONEQTENSOR(lev, MSRC_) \
658         COLL_CALCULATE_CSMOMEGAVAL(lev, lcsmomega); \
659         CSMOMEGA_STATS(lev,lcsmomega); \
660          \
661         RAC(tcel,dC ) = (1.0-lcsmomega)*MSRC_C  + lcsmomega*EQC ; \
662         RAC(tcel,dN ) = (1.0-lcsmomega)*MSRC_N  + lcsmomega*lcsmeq[ dN ]; \
663         RAC(tcel,dS ) = (1.0-lcsmomega)*MSRC_S  + lcsmomega*lcsmeq[ dS ]; \
664         RAC(tcel,dE ) = (1.0-lcsmomega)*MSRC_E  + lcsmomega*lcsmeq[ dE ]; \
665         RAC(tcel,dW ) = (1.0-lcsmomega)*MSRC_W  + lcsmomega*lcsmeq[ dW ]; \
666         RAC(tcel,dT ) = (1.0-lcsmomega)*MSRC_T  + lcsmomega*lcsmeq[ dT ]; \
667         RAC(tcel,dB ) = (1.0-lcsmomega)*MSRC_B  + lcsmomega*lcsmeq[ dB ]; \
668          \
669         RAC(tcel,dNE) = (1.0-lcsmomega)*MSRC_NE + lcsmomega*lcsmeq[ dNE]; \
670         RAC(tcel,dNW) = (1.0-lcsmomega)*MSRC_NW + lcsmomega*lcsmeq[ dNW]; \
671         RAC(tcel,dSE) = (1.0-lcsmomega)*MSRC_SE + lcsmomega*lcsmeq[ dSE]; \
672         RAC(tcel,dSW) = (1.0-lcsmomega)*MSRC_SW + lcsmomega*lcsmeq[ dSW]; \
673          \
674         RAC(tcel,dNT) = (1.0-lcsmomega)*MSRC_NT + lcsmomega*lcsmeq[ dNT]; \
675         RAC(tcel,dNB) = (1.0-lcsmomega)*MSRC_NB + lcsmomega*lcsmeq[ dNB]; \
676         RAC(tcel,dST) = (1.0-lcsmomega)*MSRC_ST + lcsmomega*lcsmeq[ dST]; \
677         RAC(tcel,dSB) = (1.0-lcsmomega)*MSRC_SB + lcsmomega*lcsmeq[ dSB]; \
678          \
679         RAC(tcel,dET) = (1.0-lcsmomega)*MSRC_ET + lcsmomega*lcsmeq[ dET]; \
680         RAC(tcel,dEB) = (1.0-lcsmomega)*MSRC_EB + lcsmomega*lcsmeq[ dEB]; \
681         RAC(tcel,dWT) = (1.0-lcsmomega)*MSRC_WT + lcsmomega*lcsmeq[ dWT]; \
682         RAC(tcel,dWB) = (1.0-lcsmomega)*MSRC_WB + lcsmomega*lcsmeq[ dWB]; \
683
684
685
686 #define  OPTIMIZED_STREAMCOLLIDE_UNUSED  \
687          \
688         rho = CSRC_C  + CSRC_N + CSRC_S  + CSRC_E + CSRC_W  + CSRC_T \
689         + CSRC_B  + CSRC_NE + CSRC_NW + CSRC_SE + CSRC_SW + CSRC_NT \
690         + CSRC_NB + CSRC_ST + CSRC_SB + CSRC_ET + CSRC_EB + CSRC_WT + CSRC_WB; \
691         ux = CSRC_E - CSRC_W + CSRC_NE - CSRC_NW + CSRC_SE - CSRC_SW \
692         + CSRC_ET + CSRC_EB - CSRC_WT - CSRC_WB; \
693         uy = CSRC_N - CSRC_S + CSRC_NE + CSRC_NW - CSRC_SE - CSRC_SW \
694         + CSRC_NT + CSRC_NB - CSRC_ST - CSRC_SB; \
695         uz = CSRC_T - CSRC_B + CSRC_NT - CSRC_NB + CSRC_ST - CSRC_SB \
696         + CSRC_ET - CSRC_EB + CSRC_WT - CSRC_WB; \
697         PRECOLLIDE_MODS(rho, ux,uy,uz, mLevel[lev].gravity); \
698         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
699         COLL_CALCULATE_DFEQ(lcsmeq); \
700         COLL_CALCULATE_NONEQTENSOR(lev, CSRC_) \
701         COLL_CALCULATE_CSMOMEGAVAL(lev, lcsmomega); \
702          \
703         RAC(tcel,dC ) = (1.0-lcsmomega)*CSRC_C  + lcsmomega*EQC ; \
704         RAC(tcel,dN ) = (1.0-lcsmomega)*CSRC_N  + lcsmomega*lcsmeq[ dN ]; \
705         RAC(tcel,dS ) = (1.0-lcsmomega)*CSRC_S  + lcsmomega*lcsmeq[ dS ]; \
706         RAC(tcel,dE ) = (1.0-lcsmomega)*CSRC_E  + lcsmomega*lcsmeq[ dE ]; \
707         RAC(tcel,dW ) = (1.0-lcsmomega)*CSRC_W  + lcsmomega*lcsmeq[ dW ]; \
708         RAC(tcel,dT ) = (1.0-lcsmomega)*CSRC_T  + lcsmomega*lcsmeq[ dT ]; \
709         RAC(tcel,dB ) = (1.0-lcsmomega)*CSRC_B  + lcsmomega*lcsmeq[ dB ]; \
710          \
711         RAC(tcel,dNE) = (1.0-lcsmomega)*CSRC_NE + lcsmomega*lcsmeq[ dNE]; \
712         RAC(tcel,dNW) = (1.0-lcsmomega)*CSRC_NW + lcsmomega*lcsmeq[ dNW]; \
713         RAC(tcel,dSE) = (1.0-lcsmomega)*CSRC_SE + lcsmomega*lcsmeq[ dSE]; \
714         RAC(tcel,dSW) = (1.0-lcsmomega)*CSRC_SW + lcsmomega*lcsmeq[ dSW]; \
715          \
716         RAC(tcel,dNT) = (1.0-lcsmomega)*CSRC_NT + lcsmomega*lcsmeq[ dNT]; \
717         RAC(tcel,dNB) = (1.0-lcsmomega)*CSRC_NB + lcsmomega*lcsmeq[ dNB]; \
718         RAC(tcel,dST) = (1.0-lcsmomega)*CSRC_ST + lcsmomega*lcsmeq[ dST]; \
719         RAC(tcel,dSB) = (1.0-lcsmomega)*CSRC_SB + lcsmomega*lcsmeq[ dSB]; \
720          \
721         RAC(tcel,dET) = (1.0-lcsmomega)*CSRC_ET + lcsmomega*lcsmeq[ dET]; \
722         RAC(tcel,dEB) = (1.0-lcsmomega)*CSRC_EB + lcsmomega*lcsmeq[ dEB]; \
723         RAC(tcel,dWT) = (1.0-lcsmomega)*CSRC_WT + lcsmomega*lcsmeq[ dWT]; \
724         RAC(tcel,dWB) = (1.0-lcsmomega)*CSRC_WB + lcsmomega*lcsmeq[ dWB]; \
725
726
727
728 #define  OPTIMIZED_STREAMCOLLIDE_NOLES  \
729          \
730         rho = CSRC_C  + CSRC_N + CSRC_S  + CSRC_E + CSRC_W  + CSRC_T \
731         + CSRC_B  + CSRC_NE + CSRC_NW + CSRC_SE + CSRC_SW + CSRC_NT \
732         + CSRC_NB + CSRC_ST + CSRC_SB + CSRC_ET + CSRC_EB + CSRC_WT + CSRC_WB; \
733         ux = CSRC_E - CSRC_W + CSRC_NE - CSRC_NW + CSRC_SE - CSRC_SW \
734         + CSRC_ET + CSRC_EB - CSRC_WT - CSRC_WB; \
735         uy = CSRC_N - CSRC_S + CSRC_NE + CSRC_NW - CSRC_SE - CSRC_SW \
736         + CSRC_NT + CSRC_NB - CSRC_ST - CSRC_SB; \
737         uz = CSRC_T - CSRC_B + CSRC_NT - CSRC_NB + CSRC_ST - CSRC_SB \
738         + CSRC_ET - CSRC_EB + CSRC_WT - CSRC_WB; \
739         PRECOLLIDE_MODS(rho, ux,uy,uz, mLevel[lev].gravity); \
740         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
741         RAC(tcel,dC ) = (1.0-OMEGA(lev))*CSRC_C  + OMEGA(lev)*EQC ; \
742         RAC(tcel,dN ) = (1.0-OMEGA(lev))*CSRC_N  + OMEGA(lev)*EQN ; \
743         RAC(tcel,dS ) = (1.0-OMEGA(lev))*CSRC_S  + OMEGA(lev)*EQS ; \
744         RAC(tcel,dE ) = (1.0-OMEGA(lev))*CSRC_E  + OMEGA(lev)*EQE ; \
745         RAC(tcel,dW ) = (1.0-OMEGA(lev))*CSRC_W  + OMEGA(lev)*EQW ; \
746         RAC(tcel,dT ) = (1.0-OMEGA(lev))*CSRC_T  + OMEGA(lev)*EQT ; \
747         RAC(tcel,dB ) = (1.0-OMEGA(lev))*CSRC_B  + OMEGA(lev)*EQB ; \
748          \
749         RAC(tcel,dNE) = (1.0-OMEGA(lev))*CSRC_NE + OMEGA(lev)*EQNE; \
750         RAC(tcel,dNW) = (1.0-OMEGA(lev))*CSRC_NW + OMEGA(lev)*EQNW; \
751         RAC(tcel,dSE) = (1.0-OMEGA(lev))*CSRC_SE + OMEGA(lev)*EQSE; \
752         RAC(tcel,dSW) = (1.0-OMEGA(lev))*CSRC_SW + OMEGA(lev)*EQSW; \
753          \
754         RAC(tcel,dNT) = (1.0-OMEGA(lev))*CSRC_NT + OMEGA(lev)*EQNT; \
755         RAC(tcel,dNB) = (1.0-OMEGA(lev))*CSRC_NB + OMEGA(lev)*EQNB; \
756         RAC(tcel,dST) = (1.0-OMEGA(lev))*CSRC_ST + OMEGA(lev)*EQST; \
757         RAC(tcel,dSB) = (1.0-OMEGA(lev))*CSRC_SB + OMEGA(lev)*EQSB; \
758          \
759         RAC(tcel,dET) = (1.0-OMEGA(lev))*CSRC_ET + OMEGA(lev)*EQET; \
760         RAC(tcel,dEB) = (1.0-OMEGA(lev))*CSRC_EB + OMEGA(lev)*EQEB; \
761         RAC(tcel,dWT) = (1.0-OMEGA(lev))*CSRC_WT + OMEGA(lev)*EQWT; \
762         RAC(tcel,dWB) = (1.0-OMEGA(lev))*CSRC_WB + OMEGA(lev)*EQWB; \
763
764
765
766
767
768 // LES switching for OPT3D
769 #if USE_LES==1
770 #define DEFAULT_COLLIDEG(grav) DEFAULT_COLLIDE_LES(grav)
771 #define OPTIMIZED_STREAMCOLLIDE OPTIMIZED_STREAMCOLLIDE_LES
772 #else 
773 #define DEFAULT_COLLIDEG(grav) DEFAULT_COLLIDE_NOLES(grav)
774 #define OPTIMIZED_STREAMCOLLIDE OPTIMIZED_STREAMCOLLIDE_NOLES
775 #endif
776
777 #endif  // 3D, opt OPT3D==true
778
779 #define USQRMAXCHECK(Cusqr,Cux,Cuy,Cuz,  CmMaxVlen,CmMxvx,CmMxvy,CmMxvz) \
780                         if(Cusqr>CmMaxVlen) { \
781                                 CmMxvx = Cux; CmMxvy = Cuy; CmMxvz = Cuz; CmMaxVlen = Cusqr; \
782                         } /* stats */ 
783
784
785
786 /******************************************************************************
787  * interpolateCellFromCoarse macros
788  *****************************************************************************/
789
790
791 // WOXDY_N = Weight Order X Dimension Y _ number N
792 #define WO1D1   ( 1.0/ 2.0)
793 #define WO1D2   ( 1.0/ 4.0)
794 #define WO1D3   ( 1.0/ 8.0)
795
796 #define WO2D1_1 (-1.0/16.0)
797 #define WO2D1_9 ( 9.0/16.0)
798
799 #define WO2D2_11 (WO2D1_1 * WO2D1_1)
800 #define WO2D2_19 (WO2D1_9 * WO2D1_1)
801 #define WO2D2_91 (WO2D1_9 * WO2D1_1)
802 #define WO2D2_99 (WO2D1_9 * WO2D1_9)
803
804 #define WO2D3_111 (WO2D1_1 * WO2D1_1 * WO2D1_1)
805 #define WO2D3_191 (WO2D1_9 * WO2D1_1 * WO2D1_1)
806 #define WO2D3_911 (WO2D1_9 * WO2D1_1 * WO2D1_1)
807 #define WO2D3_991 (WO2D1_9 * WO2D1_9 * WO2D1_1)
808 #define WO2D3_119 (WO2D1_1 * WO2D1_1 * WO2D1_9)
809 #define WO2D3_199 (WO2D1_9 * WO2D1_1 * WO2D1_9)
810 #define WO2D3_919 (WO2D1_9 * WO2D1_1 * WO2D1_9)
811 #define WO2D3_999 (WO2D1_9 * WO2D1_9 * WO2D1_9)
812
813 #if FSGR_STRICT_DEBUG==1
814 #define ADD_INT_DFSCHECK(alev, ai,aj,ak, at, afac, l) \
815                                 if(     (((1.0-(at))>0.0) && (!(QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr , l) > -1.0 ))) || \
816                                                 (((    (at))>0.0) && (!(QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setOther, l) > -1.0 ))) ){ \
817                                         errMsg("INVDFSCHECK", " l"<<(alev)<<" "<<PRINT_VEC((ai),(aj),(ak))<<" fc:"<<RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr )<<" fo:"<<RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setOther )<<" dfl"<<l ); \
818                                         debugMarkCell((alev), (ai),(aj),(ak));\
819                                         CAUSE_PANIC; \
820                                 }
821                                 // end ADD_INT_DFSCHECK
822 #define ADD_INT_FLAGCHECK(alev, ai,aj,ak, at, afac) \
823                                 if(     (((1.0-(at))>0.0) && (!(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr )&(CFInter|CFFluid|CFGrCoarseInited) ))) || \
824                                                 (((    (at))>0.0) && (!(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setOther)&(CFInter|CFFluid|CFGrCoarseInited) ))) ){ \
825                                         errMsg("INVFLAGCINTCHECK", " l"<<(alev)<<" at:"<<(at)<<" "<<PRINT_VEC((ai),(aj),(ak))<<\
826                                                         " fc:"<<   convertCellFlagType2String(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr  )) <<\
827                                                         " fold:"<< convertCellFlagType2String(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setOther )) ); \
828                                         debugMarkCell((alev), (ai),(aj),(ak));\
829                                         CAUSE_PANIC; \
830                                 }
831                                 // end ADD_INT_DFSCHECK
832                                 
833 #define INTUNUTCHECK(ix,iy,iz) \
834                                 if(     (RFLAG(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr) != (CFFluid|CFGrFromCoarse)) ){\
835                                         errMsg("INTFLAGUNU_CHECK", PRINT_VEC(i,j,k)<<" child not unused at l"<<(lev+1)<<" "<<PRINT_VEC((ix),(iy),(iz))<<" flag: "<<  RFLAG(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr) ); \
836                                         debugMarkCell((lev+1), (ix),(iy),(iz));\
837                                         CAUSE_PANIC; \
838                                 }\
839                                 RFLAG(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr) |= CFGrCoarseInited; \
840                                 // INTUNUTCHECK 
841 #define INTSTRICTCHECK(ix,iy,iz,caseId) \
842                                 if(     QCELL(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr, l) <= 0.0 ){\
843                                         errMsg("INVDFCCELLCHECK", "caseId:"<<caseId<<" "<<PRINT_VEC(i,j,k)<<" child inter at "<<PRINT_VEC((ix),(iy),(iz))<<" invalid df "<<l<<" = "<< QCELL(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr, l) ); \
844                                         debugMarkCell((lev+1), (ix),(iy),(iz));\
845                                         CAUSE_PANIC; \
846                                 }\
847                                 // INTSTRICTCHECK
848
849 #else// FSGR_STRICT_DEBUG==1
850 #define ADD_INT_FLAGCHECK(alev, ai,aj,ak, at, afac) 
851 #define ADD_INT_DFSCHECK(alev, ai,aj,ak, at, afac, l) 
852 #define INTSTRICTCHECK(x,y,z,caseId) 
853 #define INTUNUTCHECK(ix,iy,iz) 
854 #endif// FSGR_STRICT_DEBUG==1
855
856
857 #if FSGR_STRICT_DEBUG==1
858 #define INTDEBOUT \
859                 { /*LbmFloat rho,ux,uy,uz;*/ \
860                         rho = ux=uy=uz=0.0; \
861                         FORDF0{ LbmFloat m = QCELL(lev,i,j,k, dstSet, l); \
862                                 rho += m; ux  += (this->dfDvecX[l]*m); uy  += (this->dfDvecY[l]*m); uz  += (this->dfDvecZ[l]*m);  \
863                                 if(ABS(m)>1.0) { errMsg("interpolateCellFromCoarse", "ICFC_DFCHECK cell  "<<PRINT_IJK<<" m"<<l<<":"<< m );CAUSE_PANIC;}\
864                                 /*errMsg("interpolateCellFromCoarse", " cell "<<PRINT_IJK<<" df"<<l<<":"<<m );*/ \
865                         }  \
866                         /*if(this->mPanic) { errMsg("interpolateCellFromCoarse", "ICFC_DFOUT cell  "<<PRINT_IJK<<" rho:"<<rho<<" u:"<<PRINT_VEC(ux,uy,uz)<<" b"<<PRINT_VEC(betx,bety,betz) ); }*/ \
867                         if(markNbs) errMsg("interpolateCellFromCoarse", " cell "<<PRINT_IJK<<" rho:"<<rho<<" u:"<<PRINT_VEC(ux,uy,uz)<<" b"<<PRINT_VEC(betx,bety,betz) );  \
868                         /*errMsg("interpolateCellFromCoarse", "ICFC_DFDEBUG cell  "<<PRINT_IJK<<" rho:"<<rho<<" u:"<<PRINT_VEC(ux,uy,uz)<<" b"<<PRINT_VEC(betx,bety,betz) ); */\
869                 } \
870                 /* both cases are ok to interpolate */  \
871                 if( (!(RFLAG(lev,i,j,k, dstSet) & CFGrFromCoarse)) &&   \
872                                 (!(RFLAG(lev,i,j,k, dstSet) & CFUnused)) ) {    \
873                         /* might also have CFGrCoarseInited (shouldnt be a problem here)*/      \
874                         errMsg("interpolateCellFromCoarse", "CHECK cell not CFGrFromCoarse? "<<PRINT_IJK<<" flag:"<< RFLAG(lev,i,j,k, dstSet)<<" fstr:"<<convertCellFlagType2String(  RFLAG(lev,i,j,k, dstSet) ));      \
875                         /* FIXME check this warning...? return; this can happen !? */   \
876                         /*CAUSE_PANIC;*/        \
877                 }       \
878                 // end INTDEBOUT
879 #else // FSGR_STRICT_DEBUG==1
880 #define INTDEBOUT 
881 #endif // FSGR_STRICT_DEBUG==1
882
883         
884 // t=0.0 -> only current
885 // t=0.5 -> mix
886 // t=1.0 -> only other
887 #if OPT3D==0 
888 #define ADD_INT_DFS(alev, ai,aj,ak, at, afac) \
889                                                 ADD_INT_FLAGCHECK(alev, ai,aj,ak, at, afac); \
890                                                 FORDF0{ \
891                                                         LbmFloat df = ( \
892                                                                         QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr , l)*(1.0-(at)) + \
893                                                                         QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setOther, l)*(    (at)) \
894                                                                         ) ; \
895                                                         ADD_INT_DFSCHECK(alev, ai,aj,ak, at, afac, l); \
896                                                         df *= (afac); \
897                                                         rho += df;  \
898                                                         ux  += (this->dfDvecX[l]*df);  \
899                                                         uy  += (this->dfDvecY[l]*df);   \
900                                                         uz  += (this->dfDvecZ[l]*df);   \
901                                                         intDf[l] += df; \
902                                                 } 
903 // write interpolated dfs back to cell (correct non-eq. parts)
904 #define IDF_WRITEBACK_ \
905                 FORDF0{ \
906                         LbmFloat eq = getCollideEq(l, rho,ux,uy,uz);\
907                         QCELL(lev,i,j,k, dstSet, l) = (eq+ (intDf[l]-eq)*mDfScaleDown);\
908                 } \
909                 /* check that all values are ok */ \
910                 INTDEBOUT
911 #define IDF_WRITEBACK \
912                 LbmFloat omegaDst, omegaSrc;\
913                 /* smago new */ \
914                 LbmFloat feq[LBM_DFNUM]; \
915                 LbmFloat dfScale = mDfScaleDown; \
916                 FORDF0{ \
917                         feq[l] = getCollideEq(l, rho,ux,uy,uz); \
918                 } \
919                 if(mLevel[lev  ].lcsmago>0.0) {\
920                         LbmFloat Qo = this->getLesNoneqTensorCoeff(intDf,feq); \
921                         omegaDst  = this->getLesOmega(mLevel[lev+0].omega,mLevel[lev+0].lcsmago,Qo); \
922                         omegaSrc = this->getLesOmega(mLevel[lev-1].omega,mLevel[lev-1].lcsmago,Qo); \
923                 } else {\
924                         omegaDst = mLevel[lev+0].omega; \
925                         omegaSrc = mLevel[lev-1].omega;\
926                 } \
927                  \
928                 dfScale   = (mLevel[lev+0].timestep/mLevel[lev-1].timestep)* (1.0/omegaDst-1.0)/ (1.0/omegaSrc-1.0);  \
929                 FORDF0{ \
930                         /*errMsg("SMAGO"," org"<<mDfScaleDown<<" n"<<dfScale<<" qc"<< QCELL(lev,i,j,k, dstSet, l)<<" idf"<<intDf[l]<<" eq"<<feq[l] ); */ \
931                         QCELL(lev,i,j,k, dstSet, l) = (feq[l]+ (intDf[l]-feq[l])*dfScale);\
932                 } \
933                 /* check that all values are ok */ \
934                 INTDEBOUT
935
936 #else //OPT3D==0 
937
938 #define ADDALLVALS \
939         addVal = addDfFacT * RAC(addfcel , dC ); \
940                                                 intDf[dC ] += addVal; rho += addVal; \
941         addVal  = addDfFacT * RAC(addfcel , dN ); \
942                      uy+=addVal;               intDf[dN ] += addVal; rho += addVal; \
943         addVal  = addDfFacT * RAC(addfcel , dS ); \
944                      uy-=addVal;               intDf[dS ] += addVal; rho += addVal; \
945         addVal  = addDfFacT * RAC(addfcel , dE ); \
946         ux+=addVal;                            intDf[dE ] += addVal; rho += addVal; \
947         addVal  = addDfFacT * RAC(addfcel , dW ); \
948         ux-=addVal;                            intDf[dW ] += addVal; rho += addVal; \
949         addVal  = addDfFacT * RAC(addfcel , dT ); \
950                                   uz+=addVal;  intDf[dT ] += addVal; rho += addVal; \
951         addVal  = addDfFacT * RAC(addfcel , dB ); \
952                                   uz-=addVal;  intDf[dB ] += addVal; rho += addVal; \
953         addVal  = addDfFacT * RAC(addfcel , dNE); \
954         ux+=addVal; uy+=addVal;               intDf[dNE] += addVal; rho += addVal; \
955         addVal  = addDfFacT * RAC(addfcel , dNW); \
956         ux-=addVal; uy+=addVal;               intDf[dNW] += addVal; rho += addVal; \
957         addVal  = addDfFacT * RAC(addfcel , dSE); \
958         ux+=addVal; uy-=addVal;               intDf[dSE] += addVal; rho += addVal; \
959         addVal  = addDfFacT * RAC(addfcel , dSW); \
960         ux-=addVal; uy-=addVal;               intDf[dSW] += addVal; rho += addVal; \
961         addVal  = addDfFacT * RAC(addfcel , dNT); \
962                      uy+=addVal; uz+=addVal;  intDf[dNT] += addVal; rho += addVal; \
963         addVal  = addDfFacT * RAC(addfcel , dNB); \
964                      uy+=addVal; uz-=addVal;  intDf[dNB] += addVal; rho += addVal; \
965         addVal  = addDfFacT * RAC(addfcel , dST); \
966                      uy-=addVal; uz+=addVal;  intDf[dST] += addVal; rho += addVal; \
967         addVal  = addDfFacT * RAC(addfcel , dSB); \
968                      uy-=addVal; uz-=addVal;  intDf[dSB] += addVal; rho += addVal; \
969         addVal  = addDfFacT * RAC(addfcel , dET); \
970         ux+=addVal;              uz+=addVal;  intDf[dET] += addVal; rho += addVal; \
971         addVal  = addDfFacT * RAC(addfcel , dEB); \
972         ux+=addVal;              uz-=addVal;  intDf[dEB] += addVal; rho += addVal; \
973         addVal  = addDfFacT * RAC(addfcel , dWT); \
974         ux-=addVal;              uz+=addVal;  intDf[dWT] += addVal; rho += addVal; \
975         addVal  = addDfFacT * RAC(addfcel , dWB); \
976         ux-=addVal;              uz-=addVal;  intDf[dWB] += addVal; rho += addVal; 
977
978 #define ADD_INT_DFS(alev, ai,aj,ak, at, afac) \
979         addDfFacT = at*afac; \
980         addfcel = RACPNT((alev), (ai),(aj),(ak),mLevel[(alev)].setOther); \
981         ADDALLVALS\
982         addDfFacT = (1.0-at)*afac; \
983         addfcel = RACPNT((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr); \
984         ADDALLVALS
985
986 // also ugly...
987 #define INTDF_C    intDf[dC ]
988 #define INTDF_N    intDf[dN ]
989 #define INTDF_S    intDf[dS ]
990 #define INTDF_E    intDf[dE ]
991 #define INTDF_W    intDf[dW ]
992 #define INTDF_T    intDf[dT ]
993 #define INTDF_B    intDf[dB ]
994 #define INTDF_NE   intDf[dNE]
995 #define INTDF_NW   intDf[dNW]
996 #define INTDF_SE   intDf[dSE]
997 #define INTDF_SW   intDf[dSW]
998 #define INTDF_NT   intDf[dNT]
999 #define INTDF_NB   intDf[dNB]
1000 #define INTDF_ST   intDf[dST]
1001 #define INTDF_SB   intDf[dSB]
1002 #define INTDF_ET   intDf[dET]
1003 #define INTDF_EB   intDf[dEB]
1004 #define INTDF_WT   intDf[dWT]
1005 #define INTDF_WB   intDf[dWB]
1006
1007
1008 // write interpolated dfs back to cell (correct non-eq. parts)
1009 #define IDF_WRITEBACK_LES \
1010                 dstcell = RACPNT(lev, i,j,k,dstSet); \
1011                 usqr = 1.5 * (ux*ux + uy*uy + uz*uz);  \
1012                 \
1013                 lcsmeq[dC] = EQC ; \
1014                 COLL_CALCULATE_DFEQ(lcsmeq); \
1015                 COLL_CALCULATE_NONEQTENSOR(lev, INTDF_ )\
1016                 COLL_CALCULATE_CSMOMEGAVAL(lev+0, lcsmDstOmega); \
1017                 COLL_CALCULATE_CSMOMEGAVAL(lev-1, lcsmSrcOmega); \
1018                 \
1019                 lcsmdfscale   = (mLevel[lev+0].timestep/mLevel[lev-1].timestep)* (1.0/lcsmDstOmega-1.0)/ (1.0/lcsmSrcOmega-1.0);  \
1020                 RAC(dstcell, dC ) = (lcsmeq[dC ] + (intDf[dC ]-lcsmeq[dC ] )*lcsmdfscale);\
1021                 RAC(dstcell, dN ) = (lcsmeq[dN ] + (intDf[dN ]-lcsmeq[dN ] )*lcsmdfscale);\
1022                 RAC(dstcell, dS ) = (lcsmeq[dS ] + (intDf[dS ]-lcsmeq[dS ] )*lcsmdfscale);\
1023                 RAC(dstcell, dE ) = (lcsmeq[dE ] + (intDf[dE ]-lcsmeq[dE ] )*lcsmdfscale);\
1024                 RAC(dstcell, dW ) = (lcsmeq[dW ] + (intDf[dW ]-lcsmeq[dW ] )*lcsmdfscale);\
1025                 RAC(dstcell, dT ) = (lcsmeq[dT ] + (intDf[dT ]-lcsmeq[dT ] )*lcsmdfscale);\
1026                 RAC(dstcell, dB ) = (lcsmeq[dB ] + (intDf[dB ]-lcsmeq[dB ] )*lcsmdfscale);\
1027                 RAC(dstcell, dNE) = (lcsmeq[dNE] + (intDf[dNE]-lcsmeq[dNE] )*lcsmdfscale);\
1028                 RAC(dstcell, dNW) = (lcsmeq[dNW] + (intDf[dNW]-lcsmeq[dNW] )*lcsmdfscale);\
1029                 RAC(dstcell, dSE) = (lcsmeq[dSE] + (intDf[dSE]-lcsmeq[dSE] )*lcsmdfscale);\
1030                 RAC(dstcell, dSW) = (lcsmeq[dSW] + (intDf[dSW]-lcsmeq[dSW] )*lcsmdfscale);\
1031                 RAC(dstcell, dNT) = (lcsmeq[dNT] + (intDf[dNT]-lcsmeq[dNT] )*lcsmdfscale);\
1032                 RAC(dstcell, dNB) = (lcsmeq[dNB] + (intDf[dNB]-lcsmeq[dNB] )*lcsmdfscale);\
1033                 RAC(dstcell, dST) = (lcsmeq[dST] + (intDf[dST]-lcsmeq[dST] )*lcsmdfscale);\
1034                 RAC(dstcell, dSB) = (lcsmeq[dSB] + (intDf[dSB]-lcsmeq[dSB] )*lcsmdfscale);\
1035                 RAC(dstcell, dET) = (lcsmeq[dET] + (intDf[dET]-lcsmeq[dET] )*lcsmdfscale);\
1036                 RAC(dstcell, dEB) = (lcsmeq[dEB] + (intDf[dEB]-lcsmeq[dEB] )*lcsmdfscale);\
1037                 RAC(dstcell, dWT) = (lcsmeq[dWT] + (intDf[dWT]-lcsmeq[dWT] )*lcsmdfscale);\
1038                 RAC(dstcell, dWB) = (lcsmeq[dWB] + (intDf[dWB]-lcsmeq[dWB] )*lcsmdfscale);\
1039                 /* IDF_WRITEBACK optimized */
1040
1041 #define IDF_WRITEBACK_NOLES \
1042                 dstcell = RACPNT(lev, i,j,k,dstSet); \
1043                 usqr = 1.5 * (ux*ux + uy*uy + uz*uz);  \
1044                 \
1045                 RAC(dstcell, dC ) = (EQC  + (intDf[dC ]-EQC  )*mDfScaleDown);\
1046                 RAC(dstcell, dN ) = (EQN  + (intDf[dN ]-EQN  )*mDfScaleDown);\
1047                 RAC(dstcell, dS ) = (EQS  + (intDf[dS ]-EQS  )*mDfScaleDown);\
1048                 /*old*/ RAC(dstcell, dE ) = (EQE  + (intDf[dE ]-EQE  )*mDfScaleDown);\
1049                 RAC(dstcell, dW ) = (EQW  + (intDf[dW ]-EQW  )*mDfScaleDown);\
1050                 RAC(dstcell, dT ) = (EQT  + (intDf[dT ]-EQT  )*mDfScaleDown);\
1051                 RAC(dstcell, dB ) = (EQB  + (intDf[dB ]-EQB  )*mDfScaleDown);\
1052                 /*old*/ RAC(dstcell, dNE) = (EQNE + (intDf[dNE]-EQNE )*mDfScaleDown);\
1053                 RAC(dstcell, dNW) = (EQNW + (intDf[dNW]-EQNW )*mDfScaleDown);\
1054                 RAC(dstcell, dSE) = (EQSE + (intDf[dSE]-EQSE )*mDfScaleDown);\
1055                 RAC(dstcell, dSW) = (EQSW + (intDf[dSW]-EQSW )*mDfScaleDown);\
1056                 RAC(dstcell, dNT) = (EQNT + (intDf[dNT]-EQNT )*mDfScaleDown);\
1057                 RAC(dstcell, dNB) = (EQNB + (intDf[dNB]-EQNB )*mDfScaleDown);\
1058                 RAC(dstcell, dST) = (EQST + (intDf[dST]-EQST )*mDfScaleDown);\
1059                 RAC(dstcell, dSB) = (EQSB + (intDf[dSB]-EQSB )*mDfScaleDown);\
1060                 RAC(dstcell, dET) = (EQET + (intDf[dET]-EQET )*mDfScaleDown);\
1061                 /*old*/ RAC(dstcell, dEB) = (EQEB + (intDf[dEB]-EQEB )*mDfScaleDown);\
1062                 RAC(dstcell, dWT) = (EQWT + (intDf[dWT]-EQWT )*mDfScaleDown);\
1063                 RAC(dstcell, dWB) = (EQWB + (intDf[dWB]-EQWB )*mDfScaleDown);\
1064                 /* IDF_WRITEBACK optimized */
1065
1066 #if USE_LES==1
1067 #define IDF_WRITEBACK IDF_WRITEBACK_LES
1068 #else 
1069 #define IDF_WRITEBACK IDF_WRITEBACK_NOLES
1070 #endif
1071
1072 #endif// OPT3D==0 
1073
1074
1075
1076 /******************************************************************************/
1077 /*! relaxation LES functions */
1078 /******************************************************************************/
1079
1080
1081 inline LbmFloat LbmFsgrSolver::getLesNoneqTensorCoeff(
1082                 LbmFloat df[],                          
1083                 LbmFloat feq[] ) {
1084         LbmFloat Qo = 0.0;
1085         for(int m=0; m< ((LBMDIM*LBMDIM)-LBMDIM)/2 ; m++) { 
1086                 LbmFloat qadd = 0.0;
1087                 for(int l=1; l<this->cDfNum; l++) { 
1088                         if(this->lesCoeffOffdiag[m][l]==0.0) continue;
1089                         qadd += this->lesCoeffOffdiag[m][l]*(df[l]-feq[l]);
1090                 }
1091                 Qo += (qadd*qadd);
1092         }
1093         Qo *= 2.0; // off diag twice
1094         for(int m=0; m<LBMDIM; m++) { 
1095                 LbmFloat qadd = 0.0;
1096                 for(int l=1; l<this->cDfNum; l++) { 
1097                         if(this->lesCoeffDiag[m][l]==0.0) continue;
1098                         qadd += this->lesCoeffDiag[m][l]*(df[l]-feq[l]);
1099                 }
1100                 Qo += (qadd*qadd);
1101         }
1102         Qo = sqrt(Qo);
1103         return Qo;
1104 };
1105
1106 inline LbmFloat LbmFsgrSolver::getLesOmega(LbmFloat omega, LbmFloat csmago, LbmFloat Qo) {
1107         const LbmFloat tau = 1.0/omega;
1108         const LbmFloat nu = (2.0*tau-1.0) * (1.0/6.0);
1109         const LbmFloat C = csmago;
1110         const LbmFloat Csqr = C*C;
1111         LbmFloat S = -nu + sqrt( nu*nu + 18.0*Csqr*Qo ) / (6.0*Csqr);
1112         return( 1.0/( 3.0*( nu+Csqr*S ) +0.5 ) );
1113 }
1114
1115 #define DEBUG_CALCPRINTCELL(str,df) {\
1116                 LbmFloat prho=df[0], pux=0., puy=0., puz=0.; \
1117                 for(int dfl=1; dfl<this->cDfNum; dfl++) { \
1118                         prho += df[dfl];  \
1119                         pux  += (this->dfDvecX[dfl]*df[dfl]);  \
1120                         puy  += (this->dfDvecY[dfl]*df[dfl]);  \
1121                         puz  += (this->dfDvecZ[dfl]*df[dfl]);  \
1122                 } \
1123                 errMsg("DEBUG_CALCPRINTCELL",">"<<str<<" rho="<<prho<<" vel="<<ntlVec3Gfx(pux,puy,puz) ); \
1124         } /* END DEBUG_CALCPRINTCELL */ 
1125
1126 // "normal" collision
1127 inline void LbmFsgrSolver::collideArrays(
1128                 int lev, int i, int j, int k, // position - more for debugging
1129                 LbmFloat df[],                          
1130                 LbmFloat &outrho, // out only!
1131                 // velocity modifiers (returns actual velocity!)
1132                 LbmFloat &mux, LbmFloat &muy, LbmFloat &muz, 
1133                 LbmFloat omega, 
1134                 LbmVec gravity,
1135                 LbmFloat csmago, 
1136                 LbmFloat *newOmegaRet, LbmFloat *newQoRet
1137         ) {
1138         int l;
1139         LbmFloat rho=df[0]; 
1140         LbmFloat ux = 0; //mux;
1141         LbmFloat uy = 0; //muy;
1142         LbmFloat uz = 0; //muz; 
1143         LbmFloat feq[19];
1144         LbmFloat omegaNew;
1145         LbmFloat Qo = 0.0;
1146
1147         for(l=1; l<this->cDfNum; l++) { 
1148                 rho += df[l]; 
1149                 ux  += (this->dfDvecX[l]*df[l]); 
1150                 uy  += (this->dfDvecY[l]*df[l]);  
1151                 uz  += (this->dfDvecZ[l]*df[l]);  
1152         }  
1153
1154
1155         PRECOLLIDE_MODS(rho,ux,uy,uz, gravity);
1156         for(l=0; l<this->cDfNum; l++) { 
1157                 feq[l] = getCollideEq(l,rho,ux,uy,uz); 
1158         }
1159
1160         if(csmago>0.0) {
1161                 Qo = getLesNoneqTensorCoeff(df,feq);
1162                 omegaNew = getLesOmega(omega,csmago,Qo);
1163         } else {
1164                 omegaNew = omega; // smago off...
1165         }
1166         if(newOmegaRet) *newOmegaRet = omegaNew; // return value for stats
1167         if(newQoRet)    *newQoRet = Qo; // return value of non-eq. stress tensor
1168
1169         for(l=0; l<this->cDfNum; l++) { 
1170                 df[l] = (1.0-omegaNew ) * df[l] + omegaNew * feq[l]; 
1171         }  
1172         //if((i==16)&&(j==10)) DEBUG_CALCPRINTCELL( "2dcoll "<<PRINT_IJK, df);
1173
1174         mux = ux;
1175         muy = uy;
1176         muz = uz;
1177         outrho = rho;
1178
1179         lev=i=j=k; // debug, remove warnings
1180 };
1181