doxygen: add newline after \file
[blender.git] / intern / elbeem / intern / solver_relax.h
1 /** \file
2  * \ingroup elbeem
3  */
4 /******************************************************************************
5  *
6  * El'Beem - the visual lattice boltzmann freesurface simulator
7  * All code distributed as part of El'Beem is covered by the version 2 of the 
8  * GNU General Public License. See the file COPYING for details.
9  * Copyright 2003-2006 Nils Thuerey
10  *
11  * Combined 2D/3D Lattice Boltzmann relaxation macros
12  *
13  *****************************************************************************/
14
15 #if FSGR_STRICT_DEBUG==1
16 #define CAUSE_PANIC { this->mPanic=1; /* *((int*)(0x0)) = 1; crash*/ }
17 #else // FSGR_STRICT_DEBUG==1
18 #define CAUSE_PANIC { this->mPanic=1; } /*set flag*/
19 #endif // FSGR_STRICT_DEBUG==1
20         
21 /******************************************************************************
22  * normal relaxation
23  *****************************************************************************/
24
25 // standard arrays
26 #define CSRC_C    RAC(ccel                                , dC )
27 #define CSRC_E    RAC(ccel + (-1)             *(dTotalNum), dE )
28 #define CSRC_W    RAC(ccel + (+1)             *(dTotalNum), dW )
29 #define CSRC_N    RAC(ccel + (-mLevel[lev].lOffsx)        *(dTotalNum), dN )
30 #define CSRC_S    RAC(ccel + (+mLevel[lev].lOffsx)        *(dTotalNum), dS )
31 #define CSRC_NE   RAC(ccel + (-mLevel[lev].lOffsx-1)      *(dTotalNum), dNE)
32 #define CSRC_NW   RAC(ccel + (-mLevel[lev].lOffsx+1)      *(dTotalNum), dNW)
33 #define CSRC_SE   RAC(ccel + (+mLevel[lev].lOffsx-1)      *(dTotalNum), dSE)
34 #define CSRC_SW   RAC(ccel + (+mLevel[lev].lOffsx+1)      *(dTotalNum), dSW)
35 #define CSRC_T    RAC(ccel + (-mLevel[lev].lOffsy)        *(dTotalNum), dT )
36 #define CSRC_B    RAC(ccel + (+mLevel[lev].lOffsy)        *(dTotalNum), dB )
37 #define CSRC_ET   RAC(ccel + (-mLevel[lev].lOffsy-1)      *(dTotalNum), dET)
38 #define CSRC_EB   RAC(ccel + (+mLevel[lev].lOffsy-1)      *(dTotalNum), dEB)
39 #define CSRC_WT   RAC(ccel + (-mLevel[lev].lOffsy+1)      *(dTotalNum), dWT)
40 #define CSRC_WB   RAC(ccel + (+mLevel[lev].lOffsy+1)      *(dTotalNum), dWB)
41 #define CSRC_NT   RAC(ccel + (-mLevel[lev].lOffsy-mLevel[lev].lOffsx) *(dTotalNum), dNT)
42 #define CSRC_NB   RAC(ccel + (+mLevel[lev].lOffsy-mLevel[lev].lOffsx) *(dTotalNum), dNB)
43 #define CSRC_ST   RAC(ccel + (-mLevel[lev].lOffsy+mLevel[lev].lOffsx) *(dTotalNum), dST)
44 #define CSRC_SB   RAC(ccel + (+mLevel[lev].lOffsy+mLevel[lev].lOffsx) *(dTotalNum), dSB)
45
46 #define XSRC_C(x)    RAC(ccel + (x)                 *dTotalNum, dC )
47 #define XSRC_E(x)    RAC(ccel + ((x)-1)             *dTotalNum, dE )
48 #define XSRC_W(x)    RAC(ccel + ((x)+1)             *dTotalNum, dW )
49 #define XSRC_N(x)    RAC(ccel + ((x)-mLevel[lev].lOffsx)        *dTotalNum, dN )
50 #define XSRC_S(x)    RAC(ccel + ((x)+mLevel[lev].lOffsx)        *dTotalNum, dS )
51 #define XSRC_NE(x)   RAC(ccel + ((x)-mLevel[lev].lOffsx-1)      *dTotalNum, dNE)
52 #define XSRC_NW(x)   RAC(ccel + ((x)-mLevel[lev].lOffsx+1)      *dTotalNum, dNW)
53 #define XSRC_SE(x)   RAC(ccel + ((x)+mLevel[lev].lOffsx-1)      *dTotalNum, dSE)
54 #define XSRC_SW(x)   RAC(ccel + ((x)+mLevel[lev].lOffsx+1)      *dTotalNum, dSW)
55 #define XSRC_T(x)    RAC(ccel + ((x)-mLevel[lev].lOffsy)        *dTotalNum, dT )
56 #define XSRC_B(x)    RAC(ccel + ((x)+mLevel[lev].lOffsy)        *dTotalNum, dB )
57 #define XSRC_ET(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy-1)      *dTotalNum, dET)
58 #define XSRC_EB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy-1)      *dTotalNum, dEB)
59 #define XSRC_WT(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy+1)      *dTotalNum, dWT)
60 #define XSRC_WB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy+1)      *dTotalNum, dWB)
61 #define XSRC_NT(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy-mLevel[lev].lOffsx) *dTotalNum, dNT)
62 #define XSRC_NB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy-mLevel[lev].lOffsx) *dTotalNum, dNB)
63 #define XSRC_ST(x)   RAC(ccel + ((x)-mLevel[lev].lOffsy+mLevel[lev].lOffsx) *dTotalNum, dST)
64 #define XSRC_SB(x)   RAC(ccel + ((x)+mLevel[lev].lOffsy+mLevel[lev].lOffsx) *dTotalNum, dSB)
65
66
67
68 #define OMEGA(l) mLevel[(l)].omega
69
70 #define EQC (  DFL1*(rho - usqr))
71 #define EQN (  DFL2*(rho + uy*(4.5*uy + 3.0) - usqr))
72 #define EQS (  DFL2*(rho + uy*(4.5*uy - 3.0) - usqr))
73 #define EQE (  DFL2*(rho + ux*(4.5*ux + 3.0) - usqr))
74 #define EQW (  DFL2*(rho + ux*(4.5*ux - 3.0) - usqr))
75 #define EQT (  DFL2*(rho + uz*(4.5*uz + 3.0) - usqr))
76 #define EQB (  DFL2*(rho + uz*(4.5*uz - 3.0) - usqr))
77                     
78 #define EQNE ( DFL3*(rho + (+ux+uy)*(4.5*(+ux+uy) + 3.0) - usqr))
79 #define EQNW ( DFL3*(rho + (-ux+uy)*(4.5*(-ux+uy) + 3.0) - usqr))
80 #define EQSE ( DFL3*(rho + (+ux-uy)*(4.5*(+ux-uy) + 3.0) - usqr))
81 #define EQSW ( DFL3*(rho + (-ux-uy)*(4.5*(-ux-uy) + 3.0) - usqr))
82 #define EQNT ( DFL3*(rho + (+uy+uz)*(4.5*(+uy+uz) + 3.0) - usqr))
83 #define EQNB ( DFL3*(rho + (+uy-uz)*(4.5*(+uy-uz) + 3.0) - usqr))
84 #define EQST ( DFL3*(rho + (-uy+uz)*(4.5*(-uy+uz) + 3.0) - usqr))
85 #define EQSB ( DFL3*(rho + (-uy-uz)*(4.5*(-uy-uz) + 3.0) - usqr))
86 #define EQET ( DFL3*(rho + (+ux+uz)*(4.5*(+ux+uz) + 3.0) - usqr))
87 #define EQEB ( DFL3*(rho + (+ux-uz)*(4.5*(+ux-uz) + 3.0) - usqr))
88 #define EQWT ( DFL3*(rho + (-ux+uz)*(4.5*(-ux+uz) + 3.0) - usqr))
89 #define EQWB ( DFL3*(rho + (-ux-uz)*(4.5*(-ux-uz) + 3.0) - usqr))
90
91
92 // this is a bit ugly, but necessary for the CSRC_ access...
93 #define MSRC_C    m[dC ]
94 #define MSRC_N    m[dN ]
95 #define MSRC_S    m[dS ]
96 #define MSRC_E    m[dE ]
97 #define MSRC_W    m[dW ]
98 #define MSRC_T    m[dT ]
99 #define MSRC_B    m[dB ]
100 #define MSRC_NE   m[dNE]
101 #define MSRC_NW   m[dNW]
102 #define MSRC_SE   m[dSE]
103 #define MSRC_SW   m[dSW]
104 #define MSRC_NT   m[dNT]
105 #define MSRC_NB   m[dNB]
106 #define MSRC_ST   m[dST]
107 #define MSRC_SB   m[dSB]
108 #define MSRC_ET   m[dET]
109 #define MSRC_EB   m[dEB]
110 #define MSRC_WT   m[dWT]
111 #define MSRC_WB   m[dWB]
112
113 // this is a bit ugly, but necessary for the ccel local access...
114 #define CCEL_C    RAC(ccel, dC )
115 #define CCEL_N    RAC(ccel, dN )
116 #define CCEL_S    RAC(ccel, dS )
117 #define CCEL_E    RAC(ccel, dE )
118 #define CCEL_W    RAC(ccel, dW )
119 #define CCEL_T    RAC(ccel, dT )
120 #define CCEL_B    RAC(ccel, dB )
121 #define CCEL_NE   RAC(ccel, dNE)
122 #define CCEL_NW   RAC(ccel, dNW)
123 #define CCEL_SE   RAC(ccel, dSE)
124 #define CCEL_SW   RAC(ccel, dSW)
125 #define CCEL_NT   RAC(ccel, dNT)
126 #define CCEL_NB   RAC(ccel, dNB)
127 #define CCEL_ST   RAC(ccel, dST)
128 #define CCEL_SB   RAC(ccel, dSB)
129 #define CCEL_ET   RAC(ccel, dET)
130 #define CCEL_EB   RAC(ccel, dEB)
131 #define CCEL_WT   RAC(ccel, dWT)
132 #define CCEL_WB   RAC(ccel, dWB)
133 // for coarse to fine interpol access
134 #define CCELG_C(f)    (RAC(ccel, dC )*mGaussw[(f)])
135 #define CCELG_N(f)    (RAC(ccel, dN )*mGaussw[(f)])
136 #define CCELG_S(f)    (RAC(ccel, dS )*mGaussw[(f)])
137 #define CCELG_E(f)    (RAC(ccel, dE )*mGaussw[(f)])
138 #define CCELG_W(f)    (RAC(ccel, dW )*mGaussw[(f)])
139 #define CCELG_T(f)    (RAC(ccel, dT )*mGaussw[(f)])
140 #define CCELG_B(f)    (RAC(ccel, dB )*mGaussw[(f)])
141 #define CCELG_NE(f)   (RAC(ccel, dNE)*mGaussw[(f)])
142 #define CCELG_NW(f)   (RAC(ccel, dNW)*mGaussw[(f)])
143 #define CCELG_SE(f)   (RAC(ccel, dSE)*mGaussw[(f)])
144 #define CCELG_SW(f)   (RAC(ccel, dSW)*mGaussw[(f)])
145 #define CCELG_NT(f)   (RAC(ccel, dNT)*mGaussw[(f)])
146 #define CCELG_NB(f)   (RAC(ccel, dNB)*mGaussw[(f)])
147 #define CCELG_ST(f)   (RAC(ccel, dST)*mGaussw[(f)])
148 #define CCELG_SB(f)   (RAC(ccel, dSB)*mGaussw[(f)])
149 #define CCELG_ET(f)   (RAC(ccel, dET)*mGaussw[(f)])
150 #define CCELG_EB(f)   (RAC(ccel, dEB)*mGaussw[(f)])
151 #define CCELG_WT(f)   (RAC(ccel, dWT)*mGaussw[(f)])
152 #define CCELG_WB(f)   (RAC(ccel, dWB)*mGaussw[(f)])
153
154
155 #if PARALLEL==1
156 #define CSMOMEGA_STATS(dlev, domega) 
157 #else // PARALLEL==1
158 #if FSGR_OMEGA_DEBUG==1
159 #define CSMOMEGA_STATS(dlev, domega) \
160         mLevel[dlev].avgOmega += domega; mLevel[dlev].avgOmegaCnt+=1.0; 
161 #else // FSGR_OMEGA_DEBUG==1
162 #define CSMOMEGA_STATS(dlev, domega) 
163 #endif // FSGR_OMEGA_DEBUG==1
164 #endif // PARALLEL==1
165
166
167 // used for main loops and grav init
168 // source set
169 #define SRCS(l) mLevel[(l)].setCurr
170 // target set
171 #define TSET(l) mLevel[(l)].setOther
172
173 // handle mov. obj 
174 #if FSGR_STRICT_DEBUG==1
175
176 #define  LBMDS_ADDMOV(linv,l)  \
177          \
178         if((nbflag[linv]&CFBndMoving)&&(!(nbflag[l]&CFBnd))){ \
179          \
180         LbmFloat dte=QCELL_NBINV(lev, i, j, k, SRCS(lev), l,dFlux)-(mSimulationTime+this->mpParam->getTimestep()); \
181         if( ABS(dte)< 1e-15 ) { \
182         m[l]+=QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l); \
183         } else { \
184         const int sdx = i+this->dfVecX[linv], sdy = j+this->dfVecY[linv], sdz = k+this->dfVecZ[linv]; \
185          \
186         errMsg("INVALID_MOV_OBJ_TIME"," at "<<PRINT_IJK<<" from l"<<l<<" "<<PRINT_VEC(sdx,sdy,sdz)<<" t="<<(mSimulationTime+this->mpParam->getTimestep())<<" ct="<<QCELL_NBINV(lev, i, j, k, SRCS(lev), l,dFlux)<<" dte="<<dte); \
187         debugMarkCell(lev,sdx,sdy,sdz); \
188         } \
189         } \
190
191
192
193 #else // FSGR_STRICT_DEBUG==1
194
195 #define  LBMDS_ADDMOV(linv,l)  \
196          \
197          \
198         if((nbflag[linv]&CFBndMoving)&&(!(nbflag[l]&CFBnd))){ \
199          \
200         m[l]+=QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l); \
201         } \
202
203
204
205 #endif // !FSGR_STRICT_DEBUG==1
206
207 // treatment of freeslip reflection
208 // used both for OPT and nonOPT
209 #define  DEFAULT_STREAM_FREESLIP(l,invl,mnbf)  \
210          \
211         int nb1 = 0, nb2 = 0; \
212         LbmFloat newval = 0.0; \
213         const int dx = this->dfVecX[invl], dy = this->dfVecY[invl], dz = this->dfVecZ[invl]; \
214          \
215          \
216          \
217         const LbmFloat movadd = ( \
218         ((nbflag[invl]&CFBndMoving)&&(!(nbflag[l]&CFBnd))) ? \
219         (QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l)) : 0.); \
220          \
221         if(dz==0) { \
222         nb1 = !(RFLAG(lev, i,   j+dy,k, SRCS(lev))&(CFFluid|CFInter)); \
223         nb2 = !(RFLAG(lev, i+dx,j,   k, SRCS(lev))&(CFFluid|CFInter)); \
224         if((nb1)&&(!nb2)) { \
225          \
226         newval = QCELL(lev, i+dx,j,k,SRCS(lev), this->dfRefX[l]); \
227         } else \
228         if((!nb1)&&(nb2)) { \
229          \
230         newval = QCELL(lev, i,j+dy,k,SRCS(lev), this->dfRefY[l]); \
231         } else { \
232          \
233         newval = RAC(ccel, this->dfInv[l] ) +movadd /* */; \
234         } \
235         } else \
236         if(dy==0) { \
237         nb1 = !(RFLAG(lev, i,j,k+dz, SRCS(lev))&(CFFluid|CFInter)); \
238         nb2 = !(RFLAG(lev, i+dx,j,k, SRCS(lev))&(CFFluid|CFInter)); \
239         if((nb1)&&(!nb2)) { \
240          \
241         newval = QCELL(lev, i+dx,j,k,SRCS(lev), this->dfRefX[l]); \
242         } else \
243         if((!nb1)&&(nb2)) { \
244          \
245         newval = QCELL(lev, i,j,k+dz,SRCS(lev), this->dfRefZ[l]); \
246         } else { \
247          \
248         newval = RAC(ccel, this->dfInv[l] )  +movadd /* */; \
249         } \
250          \
251         } else \
252          \
253         { \
254          \
255         nb1 = !(RFLAG(lev, i,j,k+dz, SRCS(lev))&(CFFluid|CFInter)); \
256         nb2 = !(RFLAG(lev, i,j+dy,k, SRCS(lev))&(CFFluid|CFInter)); \
257         if((nb1)&&(!nb2)) { \
258          \
259         newval = QCELL(lev, i,j+dy,k,SRCS(lev), this->dfRefY[l]); \
260         } else \
261         if((!nb1)&&(nb2)) { \
262          \
263         newval = QCELL(lev, i,j,k+dz,SRCS(lev), this->dfRefZ[l]); \
264         } else { \
265          \
266         newval = RAC(ccel, this->dfInv[l] )  +movadd /* */; \
267         } \
268         } \
269          \
270         if(mnbf & CFBndPartslip) { \
271         const LbmFloat partv = mObjectPartslips[(int)(mnbf>>24)]; \
272          \
273         m[l] = (RAC(ccel, this->dfInv[l] )  +movadd /* d *(1./1.) */ ) * partv + newval * (1.0-partv); \
274         } else { \
275         m[l] = newval; \
276         } \
277          \
278
279
280
281
282 // complete default stream&collide, 2d/3d
283 /* read distribution funtions of adjacent cells = sweep step */ 
284 #if OPT3D==0 
285
286 #if FSGR_STRICT_DEBUG==1
287 #define MARKCELLCHECK \
288         debugMarkCell(lev,i,j,k); CAUSE_PANIC;
289 #define STREAMCHECK(id,ni,nj,nk,nl) \
290         if((!(m[nl] > -1.0) && (m[nl]<1.0)) ) {\
291                 errMsg("STREAMCHECK","ID"<<id<<" Invalid streamed DF nl"<<nl<<" value:"<<m[nl]<<" at "<<PRINT_IJK<<" from "<<PRINT_VEC(ni,nj,nk)<<" nl"<<(nl)<<\
292                                 " nfc"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setCurr)<<" nfo"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setOther)  ); \
293                 /*FORDF0{ errMsg("STREAMCHECK"," at "<<PRINT_IJK<<" df "<<l<<"="<<m[l] ); } */ \
294                 MARKCELLCHECK; \
295                 m[nl] = dfEquil[nl]; /* REPAIR */ \
296         }
297 #define COLLCHECK \
298         if( (rho>2.0) || (rho<-1.0) || (ABS(ux)>1.0) || (ABS(uy)>1.0) |(ABS(uz)>1.0) ) {\
299                 errMsg("COLLCHECK","Invalid collision values r:"<<rho<<" u:"PRINT_VEC(ux,uy,uz)<<" at? "<<PRINT_IJK ); \
300                 /*FORDF0{ errMsg("COLLCHECK"," at? "<<PRINT_IJK<<" df "<<l<<"="<<m[l] ); }*/ \
301                 rho=ux=uy=uz= 0.; /* REPAIR */ \
302                 MARKCELLCHECK; \
303         }
304 #else
305 #define STREAMCHECK(id, ni,nj,nk,nl) 
306 #define COLLCHECK
307 #endif
308
309 // careful ux,uy,uz need to be inited before!
310 #define  DEFAULT_STREAM  \
311         m[dC] = RAC(ccel,dC); \
312         STREAMCHECK(1, i,j,k, dC); \
313         FORDF1 { \
314         CellFlagType nbf = nbflag[ this->dfInv[l] ]; \
315         if(nbf & CFBnd) { \
316         if(nbf & CFBndNoslip) { \
317          \
318         m[l] = RAC(ccel, this->dfInv[l] ); \
319         LBMDS_ADDMOV(this->dfInv[l],l); \
320         STREAMCHECK(2, i,j,k, l); \
321         } else if(nbf & (CFBndFreeslip|CFBndPartslip)) { \
322          \
323         if(l<=LBMDIM*2) { \
324         m[l] = RAC(ccel, this->dfInv[l] ); STREAMCHECK(3, i,j,k, l); \
325         LBMDS_ADDMOV(this->dfInv[l],l); \
326         } else { \
327         const int inv_l = this->dfInv[l]; \
328         DEFAULT_STREAM_FREESLIP(l,inv_l,nbf); \
329         } \
330          \
331         } \
332         else { \
333         errMsg("LbmFsgrSolver","Invalid Bnd type at "<<PRINT_IJK<<" f"<<convertCellFlagType2String(nbf)<<",nbdir"<<this->dfInv[l] ); \
334         } \
335         } else { \
336         m[l] = QCELL_NBINV(lev, i, j, k, SRCS(lev), l,l); \
337         if(RFLAG(lev, i,j,k, mLevel[lev].setCurr)&CFFluid) { \
338         if(!(nbf&(CFFluid|CFInter)) ) { \
339         int ni=i+this->dfVecX[this->dfInv[l]], nj=j+this->dfVecY[this->dfInv[l]], nk=k+this->dfVecZ[this->dfInv[l]]; \
340         errMsg("STREAMCHECK"," Invalid nbflag, streamed DF l"<<l<<" value:"<<m[l]<<" at "<<PRINT_IJK<<" from "<< \
341         PRINT_VEC(ni,nj,nk) <<" l"<<(l)<< \
342         " nfc"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setCurr)<<" nfo"<< RFLAG(lev, ni,nj,nk, mLevel[lev].setOther)  ); \
343          \
344          \
345         } } \
346         STREAMCHECK(4, i+this->dfVecX[this->dfInv[l]], j+this->dfVecY[this->dfInv[l]],k+this->dfVecZ[this->dfInv[l]], l); \
347         } \
348         } \
349
350
351
352
353 // careful ux,uy,uz need to be inited before!
354 #define  DEFAULT_COLLIDEG(grav)  \
355         this->collideArrays(lev, i,j,k, m, rho,ux,uy,uz, OMEGA(lev), grav, mLevel[lev].lcsmago, &mDebugOmegaRet, &lcsmqo ); \
356         CSMOMEGA_STATS(lev,mDebugOmegaRet); \
357         FORDF0 { RAC(tcel,l) = m[l]; } \
358         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
359         COLLCHECK; \
360
361
362
363 #define  OPTIMIZED_STREAMCOLLIDE  \
364         m[0] = RAC(ccel,0); \
365         FORDF1 { \
366          \
367         if(RFLAG_NBINV(lev, i,j,k,SRCS(lev),l)&CFBnd) { errMsg("???", "bnd-err-nobndfl"); CAUSE_PANIC; \
368         } else { m[l] = QCELL_NBINV(lev, i, j, k, SRCS(lev), l, l); } \
369         STREAMCHECK(8, i+this->dfVecX[this->dfInv[l]], j+this->dfVecY[this->dfInv[l]],k+this->dfVecZ[this->dfInv[l]], l); \
370         } \
371         rho=m[0]; \
372         DEFAULT_COLLIDEG(mLevel[lev].gravity) \
373
374
375
376 #define  OPTIMIZED_STREAMCOLLIDE___UNUSED  \
377          \
378         this->collideArrays(lev, i,j,k, m, rho,ux,uy,uz, OMEGA(lev), mLevel[lev].gravity, mLevel[lev].lcsmago , &mDebugOmegaRet, &lcsmqo   ); \
379         CSMOMEGA_STATS(lev,mDebugOmegaRet); \
380         FORDF0 { RAC(tcel,l) = m[l]; } \
381         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
382         COLLCHECK; \
383
384
385
386 #else  // 3D, opt OPT3D==true
387
388
389 // default stream opt3d add moving bc val
390 #define  DEFAULT_STREAM  \
391         m[dC] = RAC(ccel,dC); \
392          \
393         if(0 /* ((!nbored) & CFBnd) */) { \
394          \
395         m[dN ] = CSRC_N ; m[dS ] = CSRC_S ; \
396         m[dE ] = CSRC_E ; m[dW ] = CSRC_W ; \
397         m[dT ] = CSRC_T ; m[dB ] = CSRC_B ; \
398         m[dNE] = CSRC_NE; m[dNW] = CSRC_NW; m[dSE] = CSRC_SE; m[dSW] = CSRC_SW; \
399         m[dNT] = CSRC_NT; m[dNB] = CSRC_NB; m[dST] = CSRC_ST; m[dSB] = CSRC_SB; \
400         m[dET] = CSRC_ET; m[dEB] = CSRC_EB; m[dWT] = CSRC_WT; m[dWB] = CSRC_WB; \
401         } else { \
402          \
403         if(nbflag[dS ]&CFBnd) { m[dN ] = RAC(ccel,dS ); LBMDS_ADDMOV(dS ,dN ); } else { m[dN ] = CSRC_N ; } \
404         if(nbflag[dN ]&CFBnd) { m[dS ] = RAC(ccel,dN ); LBMDS_ADDMOV(dN ,dS ); } else { m[dS ] = CSRC_S ; } \
405         if(nbflag[dW ]&CFBnd) { m[dE ] = RAC(ccel,dW ); LBMDS_ADDMOV(dW ,dE ); } else { m[dE ] = CSRC_E ; } \
406         if(nbflag[dE ]&CFBnd) { m[dW ] = RAC(ccel,dE ); LBMDS_ADDMOV(dE ,dW ); } else { m[dW ] = CSRC_W ; } \
407         if(nbflag[dB ]&CFBnd) { m[dT ] = RAC(ccel,dB ); LBMDS_ADDMOV(dB ,dT ); } else { m[dT ] = CSRC_T ; } \
408         if(nbflag[dT ]&CFBnd) { m[dB ] = RAC(ccel,dT ); LBMDS_ADDMOV(dT ,dB ); } else { m[dB ] = CSRC_B ; } \
409          \
410          \
411         if(nbflag[dSW]&CFBnd) { if(nbflag[dSW]&CFBndNoslip){ m[dNE] = RAC(ccel,dSW); LBMDS_ADDMOV(dSW,dNE); }else{ DEFAULT_STREAM_FREESLIP(dNE,dSW,nbflag[dSW]);} } else { m[dNE] = CSRC_NE; } \
412         if(nbflag[dSE]&CFBnd) { if(nbflag[dSE]&CFBndNoslip){ m[dNW] = RAC(ccel,dSE); LBMDS_ADDMOV(dSE,dNW); }else{ DEFAULT_STREAM_FREESLIP(dNW,dSE,nbflag[dSE]);} } else { m[dNW] = CSRC_NW; } \
413         if(nbflag[dNW]&CFBnd) { if(nbflag[dNW]&CFBndNoslip){ m[dSE] = RAC(ccel,dNW); LBMDS_ADDMOV(dNW,dSE); }else{ DEFAULT_STREAM_FREESLIP(dSE,dNW,nbflag[dNW]);} } else { m[dSE] = CSRC_SE; } \
414         if(nbflag[dNE]&CFBnd) { if(nbflag[dNE]&CFBndNoslip){ m[dSW] = RAC(ccel,dNE); LBMDS_ADDMOV(dNE,dSW); }else{ DEFAULT_STREAM_FREESLIP(dSW,dNE,nbflag[dNE]);} } else { m[dSW] = CSRC_SW; } \
415         if(nbflag[dSB]&CFBnd) { if(nbflag[dSB]&CFBndNoslip){ m[dNT] = RAC(ccel,dSB); LBMDS_ADDMOV(dSB,dNT); }else{ DEFAULT_STREAM_FREESLIP(dNT,dSB,nbflag[dSB]);} } else { m[dNT] = CSRC_NT; } \
416         if(nbflag[dST]&CFBnd) { if(nbflag[dST]&CFBndNoslip){ m[dNB] = RAC(ccel,dST); LBMDS_ADDMOV(dST,dNB); }else{ DEFAULT_STREAM_FREESLIP(dNB,dST,nbflag[dST]);} } else { m[dNB] = CSRC_NB; } \
417         if(nbflag[dNB]&CFBnd) { if(nbflag[dNB]&CFBndNoslip){ m[dST] = RAC(ccel,dNB); LBMDS_ADDMOV(dNB,dST); }else{ DEFAULT_STREAM_FREESLIP(dST,dNB,nbflag[dNB]);} } else { m[dST] = CSRC_ST; } \
418         if(nbflag[dNT]&CFBnd) { if(nbflag[dNT]&CFBndNoslip){ m[dSB] = RAC(ccel,dNT); LBMDS_ADDMOV(dNT,dSB); }else{ DEFAULT_STREAM_FREESLIP(dSB,dNT,nbflag[dNT]);} } else { m[dSB] = CSRC_SB; } \
419         if(nbflag[dWB]&CFBnd) { if(nbflag[dWB]&CFBndNoslip){ m[dET] = RAC(ccel,dWB); LBMDS_ADDMOV(dWB,dET); }else{ DEFAULT_STREAM_FREESLIP(dET,dWB,nbflag[dWB]);} } else { m[dET] = CSRC_ET; } \
420         if(nbflag[dWT]&CFBnd) { if(nbflag[dWT]&CFBndNoslip){ m[dEB] = RAC(ccel,dWT); LBMDS_ADDMOV(dWT,dEB); }else{ DEFAULT_STREAM_FREESLIP(dEB,dWT,nbflag[dWT]);} } else { m[dEB] = CSRC_EB; } \
421         if(nbflag[dEB]&CFBnd) { if(nbflag[dEB]&CFBndNoslip){ m[dWT] = RAC(ccel,dEB); LBMDS_ADDMOV(dEB,dWT); }else{ DEFAULT_STREAM_FREESLIP(dWT,dEB,nbflag[dEB]);} } else { m[dWT] = CSRC_WT; } \
422         if(nbflag[dET]&CFBnd) { if(nbflag[dET]&CFBndNoslip){ m[dWB] = RAC(ccel,dET); LBMDS_ADDMOV(dET,dWB); }else{ DEFAULT_STREAM_FREESLIP(dWB,dET,nbflag[dET]);} } else { m[dWB] = CSRC_WB; } \
423         } \
424
425
426
427
428
429 #define  COLL_CALCULATE_DFEQ(dstarray)  \
430         dstarray[dN ] = EQN ; dstarray[dS ] = EQS ; \
431         dstarray[dE ] = EQE ; dstarray[dW ] = EQW ; \
432         dstarray[dT ] = EQT ; dstarray[dB ] = EQB ; \
433         dstarray[dNE] = EQNE; dstarray[dNW] = EQNW; dstarray[dSE] = EQSE; dstarray[dSW] = EQSW; \
434         dstarray[dNT] = EQNT; dstarray[dNB] = EQNB; dstarray[dST] = EQST; dstarray[dSB] = EQSB; \
435         dstarray[dET] = EQET; dstarray[dEB] = EQEB; dstarray[dWT] = EQWT; dstarray[dWB] = EQWB; \
436
437
438
439 #define  COLL_CALCULATE_NONEQTENSOR(csolev, srcArray )  \
440         lcsmqadd  = (srcArray##NE - lcsmeq[ dNE ]); \
441         lcsmqadd -= (srcArray##NW - lcsmeq[ dNW ]); \
442         lcsmqadd -= (srcArray##SE - lcsmeq[ dSE ]); \
443         lcsmqadd += (srcArray##SW - lcsmeq[ dSW ]); \
444         lcsmqo = (lcsmqadd*    lcsmqadd); \
445         lcsmqadd  = (srcArray##ET - lcsmeq[  dET ]); \
446         lcsmqadd -= (srcArray##EB - lcsmeq[  dEB ]); \
447         lcsmqadd -= (srcArray##WT - lcsmeq[  dWT ]); \
448         lcsmqadd += (srcArray##WB - lcsmeq[  dWB ]); \
449         lcsmqo += (lcsmqadd*    lcsmqadd); \
450         lcsmqadd  = (srcArray##NT - lcsmeq[  dNT ]); \
451         lcsmqadd -= (srcArray##NB - lcsmeq[  dNB ]); \
452         lcsmqadd -= (srcArray##ST - lcsmeq[  dST ]); \
453         lcsmqadd += (srcArray##SB - lcsmeq[  dSB ]); \
454         lcsmqo += (lcsmqadd*    lcsmqadd); \
455         lcsmqo *= 2.0; \
456         lcsmqadd  = (srcArray##E  -  lcsmeq[ dE  ]); \
457         lcsmqadd += (srcArray##W  -  lcsmeq[ dW  ]); \
458         lcsmqadd += (srcArray##NE -  lcsmeq[ dNE ]); \
459         lcsmqadd += (srcArray##NW -  lcsmeq[ dNW ]); \
460         lcsmqadd += (srcArray##SE -  lcsmeq[ dSE ]); \
461         lcsmqadd += (srcArray##SW -  lcsmeq[ dSW ]); \
462         lcsmqadd += (srcArray##ET  - lcsmeq[ dET ]); \
463         lcsmqadd += (srcArray##EB  - lcsmeq[ dEB ]); \
464         lcsmqadd += (srcArray##WT  - lcsmeq[ dWT ]); \
465         lcsmqadd += (srcArray##WB  - lcsmeq[ dWB ]); \
466         lcsmqo += (lcsmqadd*    lcsmqadd); \
467         lcsmqadd  = (srcArray##N  -  lcsmeq[ dN  ]); \
468         lcsmqadd += (srcArray##S  -  lcsmeq[ dS  ]); \
469         lcsmqadd += (srcArray##NE -  lcsmeq[ dNE ]); \
470         lcsmqadd += (srcArray##NW -  lcsmeq[ dNW ]); \
471         lcsmqadd += (srcArray##SE -  lcsmeq[ dSE ]); \
472         lcsmqadd += (srcArray##SW -  lcsmeq[ dSW ]); \
473         lcsmqadd += (srcArray##NT  - lcsmeq[ dNT ]); \
474         lcsmqadd += (srcArray##NB  - lcsmeq[ dNB ]); \
475         lcsmqadd += (srcArray##ST  - lcsmeq[ dST ]); \
476         lcsmqadd += (srcArray##SB  - lcsmeq[ dSB ]); \
477         lcsmqo += (lcsmqadd*    lcsmqadd); \
478         lcsmqadd  = (srcArray##T  -  lcsmeq[ dT  ]); \
479         lcsmqadd += (srcArray##B  -  lcsmeq[ dB  ]); \
480         lcsmqadd += (srcArray##NT -  lcsmeq[ dNT ]); \
481         lcsmqadd += (srcArray##NB -  lcsmeq[ dNB ]); \
482         lcsmqadd += (srcArray##ST -  lcsmeq[ dST ]); \
483         lcsmqadd += (srcArray##SB -  lcsmeq[ dSB ]); \
484         lcsmqadd += (srcArray##ET  - lcsmeq[ dET ]); \
485         lcsmqadd += (srcArray##EB  - lcsmeq[ dEB ]); \
486         lcsmqadd += (srcArray##WT  - lcsmeq[ dWT ]); \
487         lcsmqadd += (srcArray##WB  - lcsmeq[ dWB ]); \
488         lcsmqo += (lcsmqadd*    lcsmqadd); \
489         lcsmqo = sqrt(lcsmqo); \
490
491
492
493 //                      COLL_CALCULATE_CSMOMEGAVAL(csolev, lcsmomega); 
494
495 // careful - need lcsmqo 
496 #define  COLL_CALCULATE_CSMOMEGAVAL(csolev, dstomega )  \
497         dstomega =  1.0/ \
498         ( 3.0*( mLevel[(csolev)].lcnu+mLevel[(csolev)].lcsmago_sqr*( \
499         -mLevel[(csolev)].lcnu + sqrt( mLevel[(csolev)].lcnu*mLevel[(csolev)].lcnu + 18.0*mLevel[(csolev)].lcsmago_sqr* lcsmqo ) \
500         / (6.0*mLevel[(csolev)].lcsmago_sqr)) \
501         ) +0.5 ); \
502
503
504
505 #define  DEFAULT_COLLIDE_LES(grav)  \
506         rho = + MSRC_C  + MSRC_N \
507         + MSRC_S  + MSRC_E \
508         + MSRC_W  + MSRC_T \
509         + MSRC_B  + MSRC_NE \
510         + MSRC_NW + MSRC_SE \
511         + MSRC_SW + MSRC_NT \
512         + MSRC_NB + MSRC_ST \
513         + MSRC_SB + MSRC_ET \
514         + MSRC_EB + MSRC_WT \
515         + MSRC_WB; \
516          \
517         ux = MSRC_E - MSRC_W \
518         + MSRC_NE - MSRC_NW \
519         + MSRC_SE - MSRC_SW \
520         + MSRC_ET + MSRC_EB \
521         - MSRC_WT - MSRC_WB ; \
522          \
523         uy = MSRC_N - MSRC_S \
524         + MSRC_NE + MSRC_NW \
525         - MSRC_SE - MSRC_SW \
526         + MSRC_NT + MSRC_NB \
527         - MSRC_ST - MSRC_SB ; \
528          \
529         uz = MSRC_T - MSRC_B \
530         + MSRC_NT - MSRC_NB \
531         + MSRC_ST - MSRC_SB \
532         + MSRC_ET - MSRC_EB \
533         + MSRC_WT - MSRC_WB ; \
534         PRECOLLIDE_MODS(rho,ux,uy,uz, grav); \
535         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
536         COLL_CALCULATE_DFEQ(lcsmeq); \
537         COLL_CALCULATE_NONEQTENSOR(lev, MSRC_); \
538         COLL_CALCULATE_CSMOMEGAVAL(lev, lcsmomega); \
539         CSMOMEGA_STATS(lev,lcsmomega); \
540          \
541         RAC(tcel,dC ) = (1.0-lcsmomega)*MSRC_C  + lcsmomega*EQC ; \
542          \
543         RAC(tcel,dN ) = (1.0-lcsmomega)*MSRC_N  + lcsmomega*lcsmeq[ dN ]; \
544         RAC(tcel,dS ) = (1.0-lcsmomega)*MSRC_S  + lcsmomega*lcsmeq[ dS ]; \
545         RAC(tcel,dE ) = (1.0-lcsmomega)*MSRC_E  + lcsmomega*lcsmeq[ dE ]; \
546         RAC(tcel,dW ) = (1.0-lcsmomega)*MSRC_W  + lcsmomega*lcsmeq[ dW ]; \
547         RAC(tcel,dT ) = (1.0-lcsmomega)*MSRC_T  + lcsmomega*lcsmeq[ dT ]; \
548         RAC(tcel,dB ) = (1.0-lcsmomega)*MSRC_B  + lcsmomega*lcsmeq[ dB ]; \
549          \
550         RAC(tcel,dNE) = (1.0-lcsmomega)*MSRC_NE + lcsmomega*lcsmeq[ dNE]; \
551         RAC(tcel,dNW) = (1.0-lcsmomega)*MSRC_NW + lcsmomega*lcsmeq[ dNW]; \
552         RAC(tcel,dSE) = (1.0-lcsmomega)*MSRC_SE + lcsmomega*lcsmeq[ dSE]; \
553         RAC(tcel,dSW) = (1.0-lcsmomega)*MSRC_SW + lcsmomega*lcsmeq[ dSW]; \
554         RAC(tcel,dNT) = (1.0-lcsmomega)*MSRC_NT + lcsmomega*lcsmeq[ dNT]; \
555         RAC(tcel,dNB) = (1.0-lcsmomega)*MSRC_NB + lcsmomega*lcsmeq[ dNB]; \
556         RAC(tcel,dST) = (1.0-lcsmomega)*MSRC_ST + lcsmomega*lcsmeq[ dST]; \
557         RAC(tcel,dSB) = (1.0-lcsmomega)*MSRC_SB + lcsmomega*lcsmeq[ dSB]; \
558         RAC(tcel,dET) = (1.0-lcsmomega)*MSRC_ET + lcsmomega*lcsmeq[ dET]; \
559         RAC(tcel,dEB) = (1.0-lcsmomega)*MSRC_EB + lcsmomega*lcsmeq[ dEB]; \
560         RAC(tcel,dWT) = (1.0-lcsmomega)*MSRC_WT + lcsmomega*lcsmeq[ dWT]; \
561         RAC(tcel,dWB) = (1.0-lcsmomega)*MSRC_WB + lcsmomega*lcsmeq[ dWB]; \
562
563
564
565 #define  DEFAULT_COLLIDE_NOLES(grav)  \
566         rho = + MSRC_C  + MSRC_N \
567         + MSRC_S  + MSRC_E \
568         + MSRC_W  + MSRC_T \
569         + MSRC_B  + MSRC_NE \
570         + MSRC_NW + MSRC_SE \
571         + MSRC_SW + MSRC_NT \
572         + MSRC_NB + MSRC_ST \
573         + MSRC_SB + MSRC_ET \
574         + MSRC_EB + MSRC_WT \
575         + MSRC_WB; \
576          \
577         ux = MSRC_E - MSRC_W \
578         + MSRC_NE - MSRC_NW \
579         + MSRC_SE - MSRC_SW \
580         + MSRC_ET + MSRC_EB \
581         - MSRC_WT - MSRC_WB ; \
582          \
583         uy = MSRC_N - MSRC_S \
584         + MSRC_NE + MSRC_NW \
585         - MSRC_SE - MSRC_SW \
586         + MSRC_NT + MSRC_NB \
587         - MSRC_ST - MSRC_SB ; \
588          \
589         uz = MSRC_T - MSRC_B \
590         + MSRC_NT - MSRC_NB \
591         + MSRC_ST - MSRC_SB \
592         + MSRC_ET - MSRC_EB \
593         + MSRC_WT - MSRC_WB ; \
594         PRECOLLIDE_MODS(rho, ux,uy,uz, grav); \
595         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
596          \
597         RAC(tcel,dC ) = (1.0-OMEGA(lev))*MSRC_C  + OMEGA(lev)*EQC ; \
598          \
599         RAC(tcel,dN ) = (1.0-OMEGA(lev))*MSRC_N  + OMEGA(lev)*EQN ; \
600         RAC(tcel,dS ) = (1.0-OMEGA(lev))*MSRC_S  + OMEGA(lev)*EQS ; \
601         RAC(tcel,dE ) = (1.0-OMEGA(lev))*MSRC_E  + OMEGA(lev)*EQE ; \
602         RAC(tcel,dW ) = (1.0-OMEGA(lev))*MSRC_W  + OMEGA(lev)*EQW ; \
603         RAC(tcel,dT ) = (1.0-OMEGA(lev))*MSRC_T  + OMEGA(lev)*EQT ; \
604         RAC(tcel,dB ) = (1.0-OMEGA(lev))*MSRC_B  + OMEGA(lev)*EQB ; \
605          \
606         RAC(tcel,dNE) = (1.0-OMEGA(lev))*MSRC_NE + OMEGA(lev)*EQNE; \
607         RAC(tcel,dNW) = (1.0-OMEGA(lev))*MSRC_NW + OMEGA(lev)*EQNW; \
608         RAC(tcel,dSE) = (1.0-OMEGA(lev))*MSRC_SE + OMEGA(lev)*EQSE; \
609         RAC(tcel,dSW) = (1.0-OMEGA(lev))*MSRC_SW + OMEGA(lev)*EQSW; \
610         RAC(tcel,dNT) = (1.0-OMEGA(lev))*MSRC_NT + OMEGA(lev)*EQNT; \
611         RAC(tcel,dNB) = (1.0-OMEGA(lev))*MSRC_NB + OMEGA(lev)*EQNB; \
612         RAC(tcel,dST) = (1.0-OMEGA(lev))*MSRC_ST + OMEGA(lev)*EQST; \
613         RAC(tcel,dSB) = (1.0-OMEGA(lev))*MSRC_SB + OMEGA(lev)*EQSB; \
614         RAC(tcel,dET) = (1.0-OMEGA(lev))*MSRC_ET + OMEGA(lev)*EQET; \
615         RAC(tcel,dEB) = (1.0-OMEGA(lev))*MSRC_EB + OMEGA(lev)*EQEB; \
616         RAC(tcel,dWT) = (1.0-OMEGA(lev))*MSRC_WT + OMEGA(lev)*EQWT; \
617         RAC(tcel,dWB) = (1.0-OMEGA(lev))*MSRC_WB + OMEGA(lev)*EQWB; \
618
619
620
621
622
623 #define  OPTIMIZED_STREAMCOLLIDE_LES  \
624          \
625         m[dC ] = CSRC_C ; \
626         m[dN ] = CSRC_N ; m[dS ] = CSRC_S ; \
627         m[dE ] = CSRC_E ; m[dW ] = CSRC_W ; \
628         m[dT ] = CSRC_T ; m[dB ] = CSRC_B ; \
629         m[dNE] = CSRC_NE; m[dNW] = CSRC_NW; m[dSE] = CSRC_SE; m[dSW] = CSRC_SW; \
630         m[dNT] = CSRC_NT; m[dNB] = CSRC_NB; m[dST] = CSRC_ST; m[dSB] = CSRC_SB; \
631         m[dET] = CSRC_ET; m[dEB] = CSRC_EB; m[dWT] = CSRC_WT; m[dWB] = CSRC_WB; \
632          \
633         rho = MSRC_C  + MSRC_N + MSRC_S  + MSRC_E + MSRC_W  + MSRC_T \
634         + MSRC_B  + MSRC_NE + MSRC_NW + MSRC_SE + MSRC_SW + MSRC_NT \
635         + MSRC_NB + MSRC_ST + MSRC_SB + MSRC_ET + MSRC_EB + MSRC_WT + MSRC_WB; \
636         ux = MSRC_E - MSRC_W + MSRC_NE - MSRC_NW + MSRC_SE - MSRC_SW \
637         + MSRC_ET + MSRC_EB - MSRC_WT - MSRC_WB; \
638         uy = MSRC_N - MSRC_S + MSRC_NE + MSRC_NW - MSRC_SE - MSRC_SW \
639         + MSRC_NT + MSRC_NB - MSRC_ST - MSRC_SB; \
640         uz = MSRC_T - MSRC_B + MSRC_NT - MSRC_NB + MSRC_ST - MSRC_SB \
641         + MSRC_ET - MSRC_EB + MSRC_WT - MSRC_WB; \
642         PRECOLLIDE_MODS(rho, ux,uy,uz, mLevel[lev].gravity); \
643         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
644         COLL_CALCULATE_DFEQ(lcsmeq); \
645         COLL_CALCULATE_NONEQTENSOR(lev, MSRC_) \
646         COLL_CALCULATE_CSMOMEGAVAL(lev, lcsmomega); \
647         CSMOMEGA_STATS(lev,lcsmomega); \
648          \
649         RAC(tcel,dC ) = (1.0-lcsmomega)*MSRC_C  + lcsmomega*EQC ; \
650         RAC(tcel,dN ) = (1.0-lcsmomega)*MSRC_N  + lcsmomega*lcsmeq[ dN ]; \
651         RAC(tcel,dS ) = (1.0-lcsmomega)*MSRC_S  + lcsmomega*lcsmeq[ dS ]; \
652         RAC(tcel,dE ) = (1.0-lcsmomega)*MSRC_E  + lcsmomega*lcsmeq[ dE ]; \
653         RAC(tcel,dW ) = (1.0-lcsmomega)*MSRC_W  + lcsmomega*lcsmeq[ dW ]; \
654         RAC(tcel,dT ) = (1.0-lcsmomega)*MSRC_T  + lcsmomega*lcsmeq[ dT ]; \
655         RAC(tcel,dB ) = (1.0-lcsmomega)*MSRC_B  + lcsmomega*lcsmeq[ dB ]; \
656          \
657         RAC(tcel,dNE) = (1.0-lcsmomega)*MSRC_NE + lcsmomega*lcsmeq[ dNE]; \
658         RAC(tcel,dNW) = (1.0-lcsmomega)*MSRC_NW + lcsmomega*lcsmeq[ dNW]; \
659         RAC(tcel,dSE) = (1.0-lcsmomega)*MSRC_SE + lcsmomega*lcsmeq[ dSE]; \
660         RAC(tcel,dSW) = (1.0-lcsmomega)*MSRC_SW + lcsmomega*lcsmeq[ dSW]; \
661          \
662         RAC(tcel,dNT) = (1.0-lcsmomega)*MSRC_NT + lcsmomega*lcsmeq[ dNT]; \
663         RAC(tcel,dNB) = (1.0-lcsmomega)*MSRC_NB + lcsmomega*lcsmeq[ dNB]; \
664         RAC(tcel,dST) = (1.0-lcsmomega)*MSRC_ST + lcsmomega*lcsmeq[ dST]; \
665         RAC(tcel,dSB) = (1.0-lcsmomega)*MSRC_SB + lcsmomega*lcsmeq[ dSB]; \
666          \
667         RAC(tcel,dET) = (1.0-lcsmomega)*MSRC_ET + lcsmomega*lcsmeq[ dET]; \
668         RAC(tcel,dEB) = (1.0-lcsmomega)*MSRC_EB + lcsmomega*lcsmeq[ dEB]; \
669         RAC(tcel,dWT) = (1.0-lcsmomega)*MSRC_WT + lcsmomega*lcsmeq[ dWT]; \
670         RAC(tcel,dWB) = (1.0-lcsmomega)*MSRC_WB + lcsmomega*lcsmeq[ dWB]; \
671
672
673
674 #define  OPTIMIZED_STREAMCOLLIDE_UNUSED  \
675          \
676         rho = CSRC_C  + CSRC_N + CSRC_S  + CSRC_E + CSRC_W  + CSRC_T \
677         + CSRC_B  + CSRC_NE + CSRC_NW + CSRC_SE + CSRC_SW + CSRC_NT \
678         + CSRC_NB + CSRC_ST + CSRC_SB + CSRC_ET + CSRC_EB + CSRC_WT + CSRC_WB; \
679         ux = CSRC_E - CSRC_W + CSRC_NE - CSRC_NW + CSRC_SE - CSRC_SW \
680         + CSRC_ET + CSRC_EB - CSRC_WT - CSRC_WB; \
681         uy = CSRC_N - CSRC_S + CSRC_NE + CSRC_NW - CSRC_SE - CSRC_SW \
682         + CSRC_NT + CSRC_NB - CSRC_ST - CSRC_SB; \
683         uz = CSRC_T - CSRC_B + CSRC_NT - CSRC_NB + CSRC_ST - CSRC_SB \
684         + CSRC_ET - CSRC_EB + CSRC_WT - CSRC_WB; \
685         PRECOLLIDE_MODS(rho, ux,uy,uz, mLevel[lev].gravity); \
686         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
687         COLL_CALCULATE_DFEQ(lcsmeq); \
688         COLL_CALCULATE_NONEQTENSOR(lev, CSRC_) \
689         COLL_CALCULATE_CSMOMEGAVAL(lev, lcsmomega); \
690          \
691         RAC(tcel,dC ) = (1.0-lcsmomega)*CSRC_C  + lcsmomega*EQC ; \
692         RAC(tcel,dN ) = (1.0-lcsmomega)*CSRC_N  + lcsmomega*lcsmeq[ dN ]; \
693         RAC(tcel,dS ) = (1.0-lcsmomega)*CSRC_S  + lcsmomega*lcsmeq[ dS ]; \
694         RAC(tcel,dE ) = (1.0-lcsmomega)*CSRC_E  + lcsmomega*lcsmeq[ dE ]; \
695         RAC(tcel,dW ) = (1.0-lcsmomega)*CSRC_W  + lcsmomega*lcsmeq[ dW ]; \
696         RAC(tcel,dT ) = (1.0-lcsmomega)*CSRC_T  + lcsmomega*lcsmeq[ dT ]; \
697         RAC(tcel,dB ) = (1.0-lcsmomega)*CSRC_B  + lcsmomega*lcsmeq[ dB ]; \
698          \
699         RAC(tcel,dNE) = (1.0-lcsmomega)*CSRC_NE + lcsmomega*lcsmeq[ dNE]; \
700         RAC(tcel,dNW) = (1.0-lcsmomega)*CSRC_NW + lcsmomega*lcsmeq[ dNW]; \
701         RAC(tcel,dSE) = (1.0-lcsmomega)*CSRC_SE + lcsmomega*lcsmeq[ dSE]; \
702         RAC(tcel,dSW) = (1.0-lcsmomega)*CSRC_SW + lcsmomega*lcsmeq[ dSW]; \
703          \
704         RAC(tcel,dNT) = (1.0-lcsmomega)*CSRC_NT + lcsmomega*lcsmeq[ dNT]; \
705         RAC(tcel,dNB) = (1.0-lcsmomega)*CSRC_NB + lcsmomega*lcsmeq[ dNB]; \
706         RAC(tcel,dST) = (1.0-lcsmomega)*CSRC_ST + lcsmomega*lcsmeq[ dST]; \
707         RAC(tcel,dSB) = (1.0-lcsmomega)*CSRC_SB + lcsmomega*lcsmeq[ dSB]; \
708          \
709         RAC(tcel,dET) = (1.0-lcsmomega)*CSRC_ET + lcsmomega*lcsmeq[ dET]; \
710         RAC(tcel,dEB) = (1.0-lcsmomega)*CSRC_EB + lcsmomega*lcsmeq[ dEB]; \
711         RAC(tcel,dWT) = (1.0-lcsmomega)*CSRC_WT + lcsmomega*lcsmeq[ dWT]; \
712         RAC(tcel,dWB) = (1.0-lcsmomega)*CSRC_WB + lcsmomega*lcsmeq[ dWB]; \
713
714
715
716 #define  OPTIMIZED_STREAMCOLLIDE_NOLES  \
717          \
718         rho = CSRC_C  + CSRC_N + CSRC_S  + CSRC_E + CSRC_W  + CSRC_T \
719         + CSRC_B  + CSRC_NE + CSRC_NW + CSRC_SE + CSRC_SW + CSRC_NT \
720         + CSRC_NB + CSRC_ST + CSRC_SB + CSRC_ET + CSRC_EB + CSRC_WT + CSRC_WB; \
721         ux = CSRC_E - CSRC_W + CSRC_NE - CSRC_NW + CSRC_SE - CSRC_SW \
722         + CSRC_ET + CSRC_EB - CSRC_WT - CSRC_WB; \
723         uy = CSRC_N - CSRC_S + CSRC_NE + CSRC_NW - CSRC_SE - CSRC_SW \
724         + CSRC_NT + CSRC_NB - CSRC_ST - CSRC_SB; \
725         uz = CSRC_T - CSRC_B + CSRC_NT - CSRC_NB + CSRC_ST - CSRC_SB \
726         + CSRC_ET - CSRC_EB + CSRC_WT - CSRC_WB; \
727         PRECOLLIDE_MODS(rho, ux,uy,uz, mLevel[lev].gravity); \
728         usqr = 1.5 * (ux*ux + uy*uy + uz*uz); \
729         RAC(tcel,dC ) = (1.0-OMEGA(lev))*CSRC_C  + OMEGA(lev)*EQC ; \
730         RAC(tcel,dN ) = (1.0-OMEGA(lev))*CSRC_N  + OMEGA(lev)*EQN ; \
731         RAC(tcel,dS ) = (1.0-OMEGA(lev))*CSRC_S  + OMEGA(lev)*EQS ; \
732         RAC(tcel,dE ) = (1.0-OMEGA(lev))*CSRC_E  + OMEGA(lev)*EQE ; \
733         RAC(tcel,dW ) = (1.0-OMEGA(lev))*CSRC_W  + OMEGA(lev)*EQW ; \
734         RAC(tcel,dT ) = (1.0-OMEGA(lev))*CSRC_T  + OMEGA(lev)*EQT ; \
735         RAC(tcel,dB ) = (1.0-OMEGA(lev))*CSRC_B  + OMEGA(lev)*EQB ; \
736          \
737         RAC(tcel,dNE) = (1.0-OMEGA(lev))*CSRC_NE + OMEGA(lev)*EQNE; \
738         RAC(tcel,dNW) = (1.0-OMEGA(lev))*CSRC_NW + OMEGA(lev)*EQNW; \
739         RAC(tcel,dSE) = (1.0-OMEGA(lev))*CSRC_SE + OMEGA(lev)*EQSE; \
740         RAC(tcel,dSW) = (1.0-OMEGA(lev))*CSRC_SW + OMEGA(lev)*EQSW; \
741          \
742         RAC(tcel,dNT) = (1.0-OMEGA(lev))*CSRC_NT + OMEGA(lev)*EQNT; \
743         RAC(tcel,dNB) = (1.0-OMEGA(lev))*CSRC_NB + OMEGA(lev)*EQNB; \
744         RAC(tcel,dST) = (1.0-OMEGA(lev))*CSRC_ST + OMEGA(lev)*EQST; \
745         RAC(tcel,dSB) = (1.0-OMEGA(lev))*CSRC_SB + OMEGA(lev)*EQSB; \
746          \
747         RAC(tcel,dET) = (1.0-OMEGA(lev))*CSRC_ET + OMEGA(lev)*EQET; \
748         RAC(tcel,dEB) = (1.0-OMEGA(lev))*CSRC_EB + OMEGA(lev)*EQEB; \
749         RAC(tcel,dWT) = (1.0-OMEGA(lev))*CSRC_WT + OMEGA(lev)*EQWT; \
750         RAC(tcel,dWB) = (1.0-OMEGA(lev))*CSRC_WB + OMEGA(lev)*EQWB; \
751
752
753
754
755
756 // LES switching for OPT3D
757 #if USE_LES==1
758 #define DEFAULT_COLLIDEG(grav) DEFAULT_COLLIDE_LES(grav)
759 #define OPTIMIZED_STREAMCOLLIDE OPTIMIZED_STREAMCOLLIDE_LES
760 #else 
761 #define DEFAULT_COLLIDEG(grav) DEFAULT_COLLIDE_NOLES(grav)
762 #define OPTIMIZED_STREAMCOLLIDE OPTIMIZED_STREAMCOLLIDE_NOLES
763 #endif
764
765 #endif  // 3D, opt OPT3D==true
766
767 #define USQRMAXCHECK(Cusqr,Cux,Cuy,Cuz,  CmMaxVlen,CmMxvx,CmMxvy,CmMxvz) \
768                         if(Cusqr>CmMaxVlen) { \
769                                 CmMxvx = Cux; CmMxvy = Cuy; CmMxvz = Cuz; CmMaxVlen = Cusqr; \
770                         } /* stats */ 
771
772
773
774 /******************************************************************************
775  * interpolateCellFromCoarse macros
776  *****************************************************************************/
777
778
779 // WOXDY_N = Weight Order X Dimension Y _ number N
780 #define WO1D1   ( 1.0/ 2.0)
781 #define WO1D2   ( 1.0/ 4.0)
782 #define WO1D3   ( 1.0/ 8.0)
783
784 #define WO2D1_1 (-1.0/16.0)
785 #define WO2D1_9 ( 9.0/16.0)
786
787 #define WO2D2_11 (WO2D1_1 * WO2D1_1)
788 #define WO2D2_19 (WO2D1_9 * WO2D1_1)
789 #define WO2D2_91 (WO2D1_9 * WO2D1_1)
790 #define WO2D2_99 (WO2D1_9 * WO2D1_9)
791
792 #define WO2D3_111 (WO2D1_1 * WO2D1_1 * WO2D1_1)
793 #define WO2D3_191 (WO2D1_9 * WO2D1_1 * WO2D1_1)
794 #define WO2D3_911 (WO2D1_9 * WO2D1_1 * WO2D1_1)
795 #define WO2D3_991 (WO2D1_9 * WO2D1_9 * WO2D1_1)
796 #define WO2D3_119 (WO2D1_1 * WO2D1_1 * WO2D1_9)
797 #define WO2D3_199 (WO2D1_9 * WO2D1_1 * WO2D1_9)
798 #define WO2D3_919 (WO2D1_9 * WO2D1_1 * WO2D1_9)
799 #define WO2D3_999 (WO2D1_9 * WO2D1_9 * WO2D1_9)
800
801 #if FSGR_STRICT_DEBUG==1
802 #define ADD_INT_DFSCHECK(alev, ai,aj,ak, at, afac, l) \
803                                 if(     (((1.0-(at))>0.0) && (!(QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr , l) > -1.0 ))) || \
804                                                 (((    (at))>0.0) && (!(QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setOther, l) > -1.0 ))) ){ \
805                                         errMsg("INVDFSCHECK", " l"<<(alev)<<" "<<PRINT_VEC((ai),(aj),(ak))<<" fc:"<<RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr )<<" fo:"<<RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setOther )<<" dfl"<<l ); \
806                                         debugMarkCell((alev), (ai),(aj),(ak));\
807                                         CAUSE_PANIC; \
808                                 }
809                                 // end ADD_INT_DFSCHECK
810 #define ADD_INT_FLAGCHECK(alev, ai,aj,ak, at, afac) \
811                                 if(     (((1.0-(at))>0.0) && (!(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr )&(CFInter|CFFluid|CFGrCoarseInited) ))) || \
812                                                 (((    (at))>0.0) && (!(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setOther)&(CFInter|CFFluid|CFGrCoarseInited) ))) ){ \
813                                         errMsg("INVFLAGCINTCHECK", " l"<<(alev)<<" at:"<<(at)<<" "<<PRINT_VEC((ai),(aj),(ak))<<\
814                                                         " fc:"<<   convertCellFlagType2String(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr  )) <<\
815                                                         " fold:"<< convertCellFlagType2String(RFLAG((alev), (ai),(aj),(ak),mLevel[(alev)].setOther )) ); \
816                                         debugMarkCell((alev), (ai),(aj),(ak));\
817                                         CAUSE_PANIC; \
818                                 }
819                                 // end ADD_INT_DFSCHECK
820                                 
821 #define INTUNUTCHECK(ix,iy,iz) \
822                                 if(     (RFLAG(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr) != (CFFluid|CFGrFromCoarse)) ){\
823                                         errMsg("INTFLAGUNU_CHECK", PRINT_VEC(i,j,k)<<" child not unused at l"<<(lev+1)<<" "<<PRINT_VEC((ix),(iy),(iz))<<" flag: "<<  RFLAG(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr) ); \
824                                         debugMarkCell((lev+1), (ix),(iy),(iz));\
825                                         CAUSE_PANIC; \
826                                 }\
827                                 RFLAG(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr) |= CFGrCoarseInited; \
828                                 // INTUNUTCHECK 
829 #define INTSTRICTCHECK(ix,iy,iz,caseId) \
830                                 if(     QCELL(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr, l) <= 0.0 ){\
831                                         errMsg("INVDFCCELLCHECK", "caseId:"<<caseId<<" "<<PRINT_VEC(i,j,k)<<" child inter at "<<PRINT_VEC((ix),(iy),(iz))<<" invalid df "<<l<<" = "<< QCELL(lev+1, (ix),(iy),(iz), mLevel[lev+1].setCurr, l) ); \
832                                         debugMarkCell((lev+1), (ix),(iy),(iz));\
833                                         CAUSE_PANIC; \
834                                 }\
835                                 // INTSTRICTCHECK
836
837 #else// FSGR_STRICT_DEBUG==1
838 #define ADD_INT_FLAGCHECK(alev, ai,aj,ak, at, afac) 
839 #define ADD_INT_DFSCHECK(alev, ai,aj,ak, at, afac, l) 
840 #define INTSTRICTCHECK(x,y,z,caseId) 
841 #define INTUNUTCHECK(ix,iy,iz) 
842 #endif// FSGR_STRICT_DEBUG==1
843
844
845 #if FSGR_STRICT_DEBUG==1
846 #define INTDEBOUT \
847                 { /*LbmFloat rho,ux,uy,uz;*/ \
848                         rho = ux=uy=uz=0.0; \
849                         FORDF0{ LbmFloat m = QCELL(lev,i,j,k, dstSet, l); \
850                                 rho += m; ux  += (this->dfDvecX[l]*m); uy  += (this->dfDvecY[l]*m); uz  += (this->dfDvecZ[l]*m);  \
851                                 if(ABS(m)>1.0) { errMsg("interpolateCellFromCoarse", "ICFC_DFCHECK cell  "<<PRINT_IJK<<" m"<<l<<":"<< m );CAUSE_PANIC;}\
852                                 /*errMsg("interpolateCellFromCoarse", " cell "<<PRINT_IJK<<" df"<<l<<":"<<m );*/ \
853                         }  \
854                         /*if(this->mPanic) { errMsg("interpolateCellFromCoarse", "ICFC_DFOUT cell  "<<PRINT_IJK<<" rho:"<<rho<<" u:"<<PRINT_VEC(ux,uy,uz)<<" b"<<PRINT_VEC(betx,bety,betz) ); }*/ \
855                         if(markNbs) errMsg("interpolateCellFromCoarse", " cell "<<PRINT_IJK<<" rho:"<<rho<<" u:"<<PRINT_VEC(ux,uy,uz)<<" b"<<PRINT_VEC(betx,bety,betz) );  \
856                         /*errMsg("interpolateCellFromCoarse", "ICFC_DFDEBUG cell  "<<PRINT_IJK<<" rho:"<<rho<<" u:"<<PRINT_VEC(ux,uy,uz)<<" b"<<PRINT_VEC(betx,bety,betz) ); */\
857                 } \
858                 /* both cases are ok to interpolate */  \
859                 if( (!(RFLAG(lev,i,j,k, dstSet) & CFGrFromCoarse)) &&   \
860                                 (!(RFLAG(lev,i,j,k, dstSet) & CFUnused)) ) {    \
861                         /* might also have CFGrCoarseInited (shouldnt be a problem here)*/      \
862                         errMsg("interpolateCellFromCoarse", "CHECK cell not CFGrFromCoarse? "<<PRINT_IJK<<" flag:"<< RFLAG(lev,i,j,k, dstSet)<<" fstr:"<<convertCellFlagType2String(  RFLAG(lev,i,j,k, dstSet) ));      \
863                         /* FIXME check this warning...? return; this can happen !? */   \
864                         /*CAUSE_PANIC;*/        \
865                 }       \
866                 // end INTDEBOUT
867 #else // FSGR_STRICT_DEBUG==1
868 #define INTDEBOUT 
869 #endif // FSGR_STRICT_DEBUG==1
870
871         
872 // t=0.0 -> only current
873 // t=0.5 -> mix
874 // t=1.0 -> only other
875 #if OPT3D==0 
876 #define ADD_INT_DFS(alev, ai,aj,ak, at, afac) \
877                                                 ADD_INT_FLAGCHECK(alev, ai,aj,ak, at, afac); \
878                                                 FORDF0{ \
879                                                         LbmFloat df = ( \
880                                                                         QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr , l)*(1.0-(at)) + \
881                                                                         QCELL((alev), (ai),(aj),(ak),mLevel[(alev)].setOther, l)*(    (at)) \
882                                                                         ) ; \
883                                                         ADD_INT_DFSCHECK(alev, ai,aj,ak, at, afac, l); \
884                                                         df *= (afac); \
885                                                         rho += df;  \
886                                                         ux  += (this->dfDvecX[l]*df);  \
887                                                         uy  += (this->dfDvecY[l]*df);   \
888                                                         uz  += (this->dfDvecZ[l]*df);   \
889                                                         intDf[l] += df; \
890                                                 } 
891 // write interpolated dfs back to cell (correct non-eq. parts)
892 #define IDF_WRITEBACK_ \
893                 FORDF0{ \
894                         LbmFloat eq = getCollideEq(l, rho,ux,uy,uz);\
895                         QCELL(lev,i,j,k, dstSet, l) = (eq+ (intDf[l]-eq)*mDfScaleDown);\
896                 } \
897                 /* check that all values are ok */ \
898                 INTDEBOUT
899 #define IDF_WRITEBACK \
900                 LbmFloat omegaDst, omegaSrc;\
901                 /* smago new */ \
902                 LbmFloat feq[LBM_DFNUM]; \
903                 LbmFloat dfScale = mDfScaleDown; \
904                 FORDF0{ \
905                         feq[l] = getCollideEq(l, rho,ux,uy,uz); \
906                 } \
907                 if(mLevel[lev  ].lcsmago>0.0) {\
908                         LbmFloat Qo = this->getLesNoneqTensorCoeff(intDf,feq); \
909                         omegaDst  = this->getLesOmega(mLevel[lev+0].omega,mLevel[lev+0].lcsmago,Qo); \
910                         omegaSrc = this->getLesOmega(mLevel[lev-1].omega,mLevel[lev-1].lcsmago,Qo); \
911                 } else {\
912                         omegaDst = mLevel[lev+0].omega; \
913                         omegaSrc = mLevel[lev-1].omega;\
914                 } \
915                  \
916                 dfScale   = (mLevel[lev+0].timestep/mLevel[lev-1].timestep)* (1.0/omegaDst-1.0)/ (1.0/omegaSrc-1.0);  \
917                 FORDF0{ \
918                         /*errMsg("SMAGO"," org"<<mDfScaleDown<<" n"<<dfScale<<" qc"<< QCELL(lev,i,j,k, dstSet, l)<<" idf"<<intDf[l]<<" eq"<<feq[l] ); */ \
919                         QCELL(lev,i,j,k, dstSet, l) = (feq[l]+ (intDf[l]-feq[l])*dfScale);\
920                 } \
921                 /* check that all values are ok */ \
922                 INTDEBOUT
923
924 #else //OPT3D==0 
925
926 #define ADDALLVALS \
927         addVal = addDfFacT * RAC(addfcel , dC ); \
928                                                 intDf[dC ] += addVal; rho += addVal; \
929         addVal  = addDfFacT * RAC(addfcel , dN ); \
930                      uy+=addVal;               intDf[dN ] += addVal; rho += addVal; \
931         addVal  = addDfFacT * RAC(addfcel , dS ); \
932                      uy-=addVal;               intDf[dS ] += addVal; rho += addVal; \
933         addVal  = addDfFacT * RAC(addfcel , dE ); \
934         ux+=addVal;                            intDf[dE ] += addVal; rho += addVal; \
935         addVal  = addDfFacT * RAC(addfcel , dW ); \
936         ux-=addVal;                            intDf[dW ] += addVal; rho += addVal; \
937         addVal  = addDfFacT * RAC(addfcel , dT ); \
938                                   uz+=addVal;  intDf[dT ] += addVal; rho += addVal; \
939         addVal  = addDfFacT * RAC(addfcel , dB ); \
940                                   uz-=addVal;  intDf[dB ] += addVal; rho += addVal; \
941         addVal  = addDfFacT * RAC(addfcel , dNE); \
942         ux+=addVal; uy+=addVal;               intDf[dNE] += addVal; rho += addVal; \
943         addVal  = addDfFacT * RAC(addfcel , dNW); \
944         ux-=addVal; uy+=addVal;               intDf[dNW] += addVal; rho += addVal; \
945         addVal  = addDfFacT * RAC(addfcel , dSE); \
946         ux+=addVal; uy-=addVal;               intDf[dSE] += addVal; rho += addVal; \
947         addVal  = addDfFacT * RAC(addfcel , dSW); \
948         ux-=addVal; uy-=addVal;               intDf[dSW] += addVal; rho += addVal; \
949         addVal  = addDfFacT * RAC(addfcel , dNT); \
950                      uy+=addVal; uz+=addVal;  intDf[dNT] += addVal; rho += addVal; \
951         addVal  = addDfFacT * RAC(addfcel , dNB); \
952                      uy+=addVal; uz-=addVal;  intDf[dNB] += addVal; rho += addVal; \
953         addVal  = addDfFacT * RAC(addfcel , dST); \
954                      uy-=addVal; uz+=addVal;  intDf[dST] += addVal; rho += addVal; \
955         addVal  = addDfFacT * RAC(addfcel , dSB); \
956                      uy-=addVal; uz-=addVal;  intDf[dSB] += addVal; rho += addVal; \
957         addVal  = addDfFacT * RAC(addfcel , dET); \
958         ux+=addVal;              uz+=addVal;  intDf[dET] += addVal; rho += addVal; \
959         addVal  = addDfFacT * RAC(addfcel , dEB); \
960         ux+=addVal;              uz-=addVal;  intDf[dEB] += addVal; rho += addVal; \
961         addVal  = addDfFacT * RAC(addfcel , dWT); \
962         ux-=addVal;              uz+=addVal;  intDf[dWT] += addVal; rho += addVal; \
963         addVal  = addDfFacT * RAC(addfcel , dWB); \
964         ux-=addVal;              uz-=addVal;  intDf[dWB] += addVal; rho += addVal; 
965
966 #define ADD_INT_DFS(alev, ai,aj,ak, at, afac) \
967         addDfFacT = at*afac; \
968         addfcel = RACPNT((alev), (ai),(aj),(ak),mLevel[(alev)].setOther); \
969         ADDALLVALS\
970         addDfFacT = (1.0-at)*afac; \
971         addfcel = RACPNT((alev), (ai),(aj),(ak),mLevel[(alev)].setCurr); \
972         ADDALLVALS
973
974 // also ugly...
975 #define INTDF_C    intDf[dC ]
976 #define INTDF_N    intDf[dN ]
977 #define INTDF_S    intDf[dS ]
978 #define INTDF_E    intDf[dE ]
979 #define INTDF_W    intDf[dW ]
980 #define INTDF_T    intDf[dT ]
981 #define INTDF_B    intDf[dB ]
982 #define INTDF_NE   intDf[dNE]
983 #define INTDF_NW   intDf[dNW]
984 #define INTDF_SE   intDf[dSE]
985 #define INTDF_SW   intDf[dSW]
986 #define INTDF_NT   intDf[dNT]
987 #define INTDF_NB   intDf[dNB]
988 #define INTDF_ST   intDf[dST]
989 #define INTDF_SB   intDf[dSB]
990 #define INTDF_ET   intDf[dET]
991 #define INTDF_EB   intDf[dEB]
992 #define INTDF_WT   intDf[dWT]
993 #define INTDF_WB   intDf[dWB]
994
995
996 // write interpolated dfs back to cell (correct non-eq. parts)
997 #define IDF_WRITEBACK_LES \
998                 dstcell = RACPNT(lev, i,j,k,dstSet); \
999                 usqr = 1.5 * (ux*ux + uy*uy + uz*uz);  \
1000                 \
1001                 lcsmeq[dC] = EQC ; \
1002                 COLL_CALCULATE_DFEQ(lcsmeq); \
1003                 COLL_CALCULATE_NONEQTENSOR(lev, INTDF_ )\
1004                 COLL_CALCULATE_CSMOMEGAVAL(lev+0, lcsmDstOmega); \
1005                 COLL_CALCULATE_CSMOMEGAVAL(lev-1, lcsmSrcOmega); \
1006                 \
1007                 lcsmdfscale   = (mLevel[lev+0].timestep/mLevel[lev-1].timestep)* (1.0/lcsmDstOmega-1.0)/ (1.0/lcsmSrcOmega-1.0);  \
1008                 RAC(dstcell, dC ) = (lcsmeq[dC ] + (intDf[dC ]-lcsmeq[dC ] )*lcsmdfscale);\
1009                 RAC(dstcell, dN ) = (lcsmeq[dN ] + (intDf[dN ]-lcsmeq[dN ] )*lcsmdfscale);\
1010                 RAC(dstcell, dS ) = (lcsmeq[dS ] + (intDf[dS ]-lcsmeq[dS ] )*lcsmdfscale);\
1011                 RAC(dstcell, dE ) = (lcsmeq[dE ] + (intDf[dE ]-lcsmeq[dE ] )*lcsmdfscale);\
1012                 RAC(dstcell, dW ) = (lcsmeq[dW ] + (intDf[dW ]-lcsmeq[dW ] )*lcsmdfscale);\
1013                 RAC(dstcell, dT ) = (lcsmeq[dT ] + (intDf[dT ]-lcsmeq[dT ] )*lcsmdfscale);\
1014                 RAC(dstcell, dB ) = (lcsmeq[dB ] + (intDf[dB ]-lcsmeq[dB ] )*lcsmdfscale);\
1015                 RAC(dstcell, dNE) = (lcsmeq[dNE] + (intDf[dNE]-lcsmeq[dNE] )*lcsmdfscale);\
1016                 RAC(dstcell, dNW) = (lcsmeq[dNW] + (intDf[dNW]-lcsmeq[dNW] )*lcsmdfscale);\
1017                 RAC(dstcell, dSE) = (lcsmeq[dSE] + (intDf[dSE]-lcsmeq[dSE] )*lcsmdfscale);\
1018                 RAC(dstcell, dSW) = (lcsmeq[dSW] + (intDf[dSW]-lcsmeq[dSW] )*lcsmdfscale);\
1019                 RAC(dstcell, dNT) = (lcsmeq[dNT] + (intDf[dNT]-lcsmeq[dNT] )*lcsmdfscale);\
1020                 RAC(dstcell, dNB) = (lcsmeq[dNB] + (intDf[dNB]-lcsmeq[dNB] )*lcsmdfscale);\
1021                 RAC(dstcell, dST) = (lcsmeq[dST] + (intDf[dST]-lcsmeq[dST] )*lcsmdfscale);\
1022                 RAC(dstcell, dSB) = (lcsmeq[dSB] + (intDf[dSB]-lcsmeq[dSB] )*lcsmdfscale);\
1023                 RAC(dstcell, dET) = (lcsmeq[dET] + (intDf[dET]-lcsmeq[dET] )*lcsmdfscale);\
1024                 RAC(dstcell, dEB) = (lcsmeq[dEB] + (intDf[dEB]-lcsmeq[dEB] )*lcsmdfscale);\
1025                 RAC(dstcell, dWT) = (lcsmeq[dWT] + (intDf[dWT]-lcsmeq[dWT] )*lcsmdfscale);\
1026                 RAC(dstcell, dWB) = (lcsmeq[dWB] + (intDf[dWB]-lcsmeq[dWB] )*lcsmdfscale);\
1027                 /* IDF_WRITEBACK optimized */
1028
1029 #define IDF_WRITEBACK_NOLES \
1030                 dstcell = RACPNT(lev, i,j,k,dstSet); \
1031                 usqr = 1.5 * (ux*ux + uy*uy + uz*uz);  \
1032                 \
1033                 RAC(dstcell, dC ) = (EQC  + (intDf[dC ]-EQC  )*mDfScaleDown);\
1034                 RAC(dstcell, dN ) = (EQN  + (intDf[dN ]-EQN  )*mDfScaleDown);\
1035                 RAC(dstcell, dS ) = (EQS  + (intDf[dS ]-EQS  )*mDfScaleDown);\
1036                 /*old*/ RAC(dstcell, dE ) = (EQE  + (intDf[dE ]-EQE  )*mDfScaleDown);\
1037                 RAC(dstcell, dW ) = (EQW  + (intDf[dW ]-EQW  )*mDfScaleDown);\
1038                 RAC(dstcell, dT ) = (EQT  + (intDf[dT ]-EQT  )*mDfScaleDown);\
1039                 RAC(dstcell, dB ) = (EQB  + (intDf[dB ]-EQB  )*mDfScaleDown);\
1040                 /*old*/ RAC(dstcell, dNE) = (EQNE + (intDf[dNE]-EQNE )*mDfScaleDown);\
1041                 RAC(dstcell, dNW) = (EQNW + (intDf[dNW]-EQNW )*mDfScaleDown);\
1042                 RAC(dstcell, dSE) = (EQSE + (intDf[dSE]-EQSE )*mDfScaleDown);\
1043                 RAC(dstcell, dSW) = (EQSW + (intDf[dSW]-EQSW )*mDfScaleDown);\
1044                 RAC(dstcell, dNT) = (EQNT + (intDf[dNT]-EQNT )*mDfScaleDown);\
1045                 RAC(dstcell, dNB) = (EQNB + (intDf[dNB]-EQNB )*mDfScaleDown);\
1046                 RAC(dstcell, dST) = (EQST + (intDf[dST]-EQST )*mDfScaleDown);\
1047                 RAC(dstcell, dSB) = (EQSB + (intDf[dSB]-EQSB )*mDfScaleDown);\
1048                 RAC(dstcell, dET) = (EQET + (intDf[dET]-EQET )*mDfScaleDown);\
1049                 /*old*/ RAC(dstcell, dEB) = (EQEB + (intDf[dEB]-EQEB )*mDfScaleDown);\
1050                 RAC(dstcell, dWT) = (EQWT + (intDf[dWT]-EQWT )*mDfScaleDown);\
1051                 RAC(dstcell, dWB) = (EQWB + (intDf[dWB]-EQWB )*mDfScaleDown);\
1052                 /* IDF_WRITEBACK optimized */
1053
1054 #if USE_LES==1
1055 #define IDF_WRITEBACK IDF_WRITEBACK_LES
1056 #else 
1057 #define IDF_WRITEBACK IDF_WRITEBACK_NOLES
1058 #endif
1059
1060 #endif// OPT3D==0 
1061
1062
1063
1064 /******************************************************************************/
1065 /*! relaxation LES functions */
1066 /******************************************************************************/
1067
1068
1069 inline LbmFloat LbmFsgrSolver::getLesNoneqTensorCoeff(
1070                 LbmFloat df[],                          
1071                 LbmFloat feq[] ) {
1072         LbmFloat Qo = 0.0;
1073         for(int m=0; m< ((LBMDIM*LBMDIM)-LBMDIM)/2 ; m++) { 
1074                 LbmFloat qadd = 0.0;
1075                 for(int l=1; l<this->cDfNum; l++) { 
1076                         if(this->lesCoeffOffdiag[m][l]==0.0) continue;
1077                         qadd += this->lesCoeffOffdiag[m][l]*(df[l]-feq[l]);
1078                 }
1079                 Qo += (qadd*qadd);
1080         }
1081         Qo *= 2.0; // off diag twice
1082         for(int m=0; m<LBMDIM; m++) { 
1083                 LbmFloat qadd = 0.0;
1084                 for(int l=1; l<this->cDfNum; l++) { 
1085                         if(this->lesCoeffDiag[m][l]==0.0) continue;
1086                         qadd += this->lesCoeffDiag[m][l]*(df[l]-feq[l]);
1087                 }
1088                 Qo += (qadd*qadd);
1089         }
1090         Qo = sqrt(Qo);
1091         return Qo;
1092 };
1093
1094 inline LbmFloat LbmFsgrSolver::getLesOmega(LbmFloat omega, LbmFloat csmago, LbmFloat Qo) {
1095         const LbmFloat tau = 1.0/omega;
1096         const LbmFloat nu = (2.0*tau-1.0) * (1.0/6.0);
1097         const LbmFloat C = csmago;
1098         const LbmFloat Csqr = C*C;
1099         LbmFloat S = -nu + sqrt( nu*nu + 18.0*Csqr*Qo ) / (6.0*Csqr);
1100         return( 1.0/( 3.0*( nu+Csqr*S ) +0.5 ) );
1101 }
1102
1103 #define DEBUG_CALCPRINTCELL(str,df) {\
1104                 LbmFloat prho=df[0], pux=0., puy=0., puz=0.; \
1105                 for(int dfl=1; dfl<this->cDfNum; dfl++) { \
1106                         prho += df[dfl];  \
1107                         pux  += (this->dfDvecX[dfl]*df[dfl]);  \
1108                         puy  += (this->dfDvecY[dfl]*df[dfl]);  \
1109                         puz  += (this->dfDvecZ[dfl]*df[dfl]);  \
1110                 } \
1111                 errMsg("DEBUG_CALCPRINTCELL",">"<<str<<" rho="<<prho<<" vel="<<ntlVec3Gfx(pux,puy,puz) ); \
1112         } /* END DEBUG_CALCPRINTCELL */ 
1113
1114 // "normal" collision
1115 inline void LbmFsgrSolver::collideArrays(
1116                 int lev, int i, int j, int k, // position - more for debugging
1117                 LbmFloat df[],                          
1118                 LbmFloat &outrho, // out only!
1119                 // velocity modifiers (returns actual velocity!)
1120                 LbmFloat &mux, LbmFloat &muy, LbmFloat &muz, 
1121                 LbmFloat omega, 
1122                 LbmVec gravity,
1123                 LbmFloat csmago, 
1124                 LbmFloat *newOmegaRet, LbmFloat *newQoRet
1125         ) {
1126         int l;
1127         LbmFloat rho=df[0]; 
1128         LbmFloat ux = 0; //mux;
1129         LbmFloat uy = 0; //muy;
1130         LbmFloat uz = 0; //muz; 
1131         LbmFloat feq[19];
1132         LbmFloat omegaNew;
1133         LbmFloat Qo = 0.0;
1134
1135         for(l=1; l<this->cDfNum; l++) { 
1136                 rho += df[l]; 
1137                 ux  += (this->dfDvecX[l]*df[l]); 
1138                 uy  += (this->dfDvecY[l]*df[l]);  
1139                 uz  += (this->dfDvecZ[l]*df[l]);  
1140         }  
1141
1142
1143         PRECOLLIDE_MODS(rho,ux,uy,uz, gravity);
1144         for(l=0; l<this->cDfNum; l++) { 
1145                 feq[l] = getCollideEq(l,rho,ux,uy,uz); 
1146         }
1147
1148         if(csmago>0.0) {
1149                 Qo = getLesNoneqTensorCoeff(df,feq);
1150                 omegaNew = getLesOmega(omega,csmago,Qo);
1151         } else {
1152                 omegaNew = omega; // smago off...
1153         }
1154         if(newOmegaRet) *newOmegaRet = omegaNew; // return value for stats
1155         if(newQoRet)    *newQoRet = Qo; // return value of non-eq. stress tensor
1156
1157         for(l=0; l<this->cDfNum; l++) { 
1158                 df[l] = (1.0-omegaNew ) * df[l] + omegaNew * feq[l]; 
1159         }  
1160         //if((i==16)&&(j==10)) DEBUG_CALCPRINTCELL( "2dcoll "<<PRINT_IJK, df);
1161
1162         mux = ux;
1163         muy = uy;
1164         muz = uz;
1165         outrho = rho;
1166
1167         lev=i=j=k; // debug, remove warnings
1168 };
1169