文献阅读:物理信息的神经网络与湍流传质的非封闭机制模型相结合
Physics-informed neural network integrate with unclosed mechanism model for turbulent mass transfer
文献摘要
本文通过比较DNN、PINN和湍流施密特模型在求解湍流传质过程中的速度场、压力场和浓度场的能力,采用控制边界条件的方法,论证了PINN在该方面的优势。且文献中所开发的PINN能够以足够的精度即时预测浓度分布,并可作为输出结果用于逆计算,以估计湍流粘度和质量扩散率,表明它在整合实验数据方面的潜力。
提出问题
- 在传统CFD的RANS模型中,普遍存在着计算复杂、计算资源紧张、所建立的计算方法也难以求解反问题的缺点。
- 将深度学习方法集成到CFD分析中,神经网络模型没有考虑到现有的先验物理信息,导致在代入偏微分方程(PDEs)的复杂系统时,可解释性和泛化能力较差。
- 在PINN问世以来,使用PINN求解严格的湍流传质问题较少,研究主要集中在基于准数(quasi-number)相关方法的层流或湍流问题。
提出方案
为了填补PINN在湍流传质的问题部分的空白,文献中将PINN方法推广到紊流条件下的物质微观混合过程,并将其视为紊流传质问题,并提出了一种将观测数据与非封闭机理模型相结合的PINN方法,用于求解湍流传质的各种正、逆问题。
实验设置
如图所示,文献中采用的器皿为二维矩形箱,并跟踪其荧光素在箱中的传质过程。
矩形长0.02米,宽0.01米。纯水(A)从入口1 (x = 0,y∈[0,0.01])以均匀速度= 1m /s进入系统,水(A)与荧光素钠(B)的混合物从入口2 (x∈[0.002,0.004],y = 0)以均匀速度v = 0.1 m/s进入系统入口2处荧光素钠的浓度用C0表示,且因情况而异。具有这种边界条件的流体可以表示为紊流。
分别对五种不同的荧光浓度ec0 = 0.1、0.3、0.5、0.9和1 kg/m3进行了模拟。选取c0 = 0.1、0.5和0.9的稀疏数据点作为观测数据集,训练PINN。c0 = 0.3和1 kg/m3的数据点构成验证的数据集。
采用基于RANS方程的双方程传质模型,通过CFD模拟提供了用于训练PINN和验证结果的数据集。模拟中使用的双方程模型参数采用重整化群法推导,并与我们前期研究的实验进行了验证。
根据速度场、压力场和浓度场对入口2处初始荧光浓度C0的依赖性来评估本研究中开发的PINN的重建和预测能力。
在本研究中,壁面边界采用无滑移假设,入口边界湍流粘度为牛顿粘度的10倍,将计算域划分为20 K个网格(y方向100个× x方向200个),可以有效地平衡数值精度和计算负担。在本研究中,使用稀疏数据(CFD模拟结果中的5‰点)对PINN进行训练。
所需方程介绍
雷诺时均方程(RANS)
由三部分组成,分别为连续性方程、动量方程、能量方程:
式中p、ui、xi分别为压力、速度和位置;下标i表示图1所示二维系统可以取x、y的坐标方向。C为时间平均浓度;ρ、μm和Dm分别为密度、层流粘度和层流质量扩散系数,μt和Dt分别为湍流粘度和湍流质量扩散系数。
基于RANS模型所衍生的K-epsilon和模型用于求解上述RANS方程,还通过施密特数求解了湍流质量扩散率与湍流粘度之间的关系的湍流施密特数模型。
K-epsilon两方程模型
具体方程如下:
其中k和ε为湍流动能及其耗散率。模型参数由实验方法获得。
Gk表示湍流粘性耗散,可通过以下公式计算:
湍流扩散系数Dt传统上由湍流施密特模型计算,表示为:
其中Sct为湍流施密特数,经验固定在0.7 ~ 0.98的范围内。在实践中,固定的湍流施密特数假设往往会导致较大的误差;为了减小误差,引入浓度方差c′2及其耗散率εc′来计算Dt:
神经网络框架
文献中采用的DNN(a)和PINN(b)框架如下图所示:
浓度C0作为输入,所有速度分量u和v分别在x和y方向上的场,过程中的压力P和浓度C作为输出。
DNN部分
直接的损失由观测值之间的差异(u, v * P * C *)和预测值款(̂u, v̂,P̂,Ĉ)对于任何给定的输入(x, y * C * 0)。以损失函数为目标,反向传播算法用于优化权重和阈值(参数隐藏层)在训练过程中,使模型在观测输入点处的输出近似于观测值。
损失函数定义
式中,u*、v*、P*、C*为状态变量的观测值,n *、n *、P*、C*为PINN或DNN的输出值,j、m、x j、m、y j和spe j分别为连续性方程、x方向动量方程、y方向动量方程和质量守恒方程的函数残差。式(6)-(7)中的所有λ都是添加到损失方程中的权重,用于缩放不同状态变量或偏微分方程的损失项。根据其损失的数量级,本研究将λD,u和λP,momx, λD,v和λD,P和λD,C, λP,con和λP,momy和λP,spe分别固定为1,0.001,10。
PINN部分
损失函数定义
物理信息由NS方程提供,这些偏微分方程在数学上描述了湍流传质过程,并通过偏微分方程函数的残差值贡献了总损失。在(b)中所示的pde函数中,湍流粘度μt和湍流质量扩散率Dt的模型是不可用的。相反,这两个参数被处理为PINN的输出。在PINN训练过程中,用于优化权值和阈值的损失函数为:
LD和LP分别表示相对于观测数据和物理信息的损失,λD和λP分别表示平衡两种损失大小的权重;观测数据中的样本点个数为nD。
两个网络所采用超参数
两者对比
物理信息损失LP的计算可分为两个步骤。首先,将AD算法(Bradley et al, 2022)应用于神经网络,在不进行数值微分的情况下解析计算偏微分方程中的偏微分项。然后,通过在计算域中采样nP个单独的坐标点,并代入PINN的物理信息部分,计算四个偏微分方程函数的残差。与DNN相似,PINN模型在训练过程中通过反向传播算法对权值和阈值进行优化,从而保证输出同时满足偏微分方程约束和观测值。
当λP/λD趋近于0时,PINN逐渐等价于DNN,神经网络仅受观测数据约束。当λP/λD趋于无穷大时,神经网络主要受方程(1)-(3)所示的偏微分方程约束,该偏微分方程不闭合。
误差分析
为了探讨λP/λD值对PINN方法模型预测精度的影响,本文以均方误差(MSE)为指标,对参数值进行敏感性分析,MSE定义为:
其中upe和UOri分别为深度学习模型的预测值和CFD模拟生成的原始值。
结果展示
在C0 = 0.5 kg/m3时,用PINN和DNN重建的速度场、压力场和浓度场。训练采用稀疏观测数据,即CFD模拟结果数据点的5‰。为了定量分析PINN和DNN的重建精度,采用上述所示的MSE。所得结果如下图所示:
(a)x方向速度场、(b) y方向速度场、(c)压力场、(d) C0 = 0.5 kg/m3浓度场;MSE差距可见下表:
在表中,PINN在物理场重建中比DNN更精确,因为PINN的MSE明显小于DNN。使用所示架构的稀疏数据进行训练后,DNN出现过拟合现象,因此在重构的物理场中,某些点的梯度过大,如结果对比图中最右列所示。相比之下,从图中第二列可以看出,通过最小化PDE函数中微分项的残差的绝对值,PINN能够限制过度的梯度。结果表明,PINN框架中的物理信息可以辅助神经网络的训练,以提高其输出精度。
为了分析PINN对训练集外浓度场(C0∕∈{0.1,0.5,0.9}kg/m3)的预测能力,为了进行比较,给出了DNN方法和湍流施密特数模型(turr - sc)的结果;结果如下:
(a)原始数据,(b) PINN预测结果,(c) DNN预测结果,(d) sct = 0.7的湍流Schmidt模型计算结果,C0 = 1 kg/m3浓度场。
MSE结果如下所示:
从上图可以看出,湍流施密特数模型计算的浓度分布在enc0 = 0.3 kg/m3时较为准确,MSE为1.39E-04。但当c0 = 1 kg/m3时,其精度降低,MSE为1.54E-03,表明湍流施密特数模型不再适用于过程浓度分布的预测。相比之下,PINN在训练集区间内(C0 = 0.3∈[0.1,0.9]kg/m3)和训练集区间外(C0 = 1∕∈[0.1,0.9]kg/m3)的浓度分布预测都是准确的,均方误差小于1E-4,这表明PINN比纯数据驱动的dnn和湍流施密特数模型具有更好的泛化能力。
噪声数据的参与
观测数据也可能来源于实验测量,为了考察PINN方法结合实验数据的有效性,在PINN和DNN的训练数据集中加入了10%量级的噪声扰动。
图为在C0 = 0.5 kg/m3时,使用受噪声污染的训练数据,用PINN和DNN重建速度、压力和浓度分布的结果,原始数据加噪后的物理场分布如图最右列所示。
当λP/λD = 5E-7时,结合无噪声观测数据的PINN的总MSE最小。在数据中加入10%的噪声后,相应的最优λP/λD增加到1E-6,说明损失函数中物理信息和观测数据的权重值与其精度应呈正相关
紊流粘度和扩散系数的逆计算
为了研究观测数据个数对求解反问题精度的影响,在各边界条件下分别选取400、900、1600、2500、3600个观测点,组成观测数据集进行PINN训练,预测湍流系数的均方差。如图所示,当观测数据中的点数增加到2500时,湍流粘度和质量扩散率分布的计算精度不再明显下降。
下图(a)为本文采用的紊流传质双方程机理模型得到的紊流粘度和紊流扩散率分布的原始数据。图(b)和图(c)分别显示了用PINN方法预测的100和2500个观测点的湍流粘度μt和质量扩散率Dt分布。对比图(b)和图(c)可知,数据点的增加提高了两侧壁面附近湍流粘度μt的计算精度;而在距离墙体较远的位置(Y∈[0.002,0.008]m),用PINN方法得到的μt和Dt精度较差,不能通过增加观测点来提高。
这是由于PINN中的物理信息其粘度项和湍流系数在近壁区域近似为零,此该区域的PDE残差和PINN的总残差不受μt和Dt预测值的影响,使得μt和Dt在远离壁的位置没有得到充分的约束,而Dt的输出只受一个种守恒方程的约束,这导致μt的约束强于Dt的约束。因此,在PINN的输出中μt的分布比Dt的分布更接近原始数据,特别是在靠近壁面的位置。
基于逆问题的复合PINN
框架如下:
在框架中利用施密特数的相关性,将湍流施密特数相关方程和湍流粘度的进口边界条件作为保保度较低的先验物理信息嵌入到Multi-PINN框架的损失函数中。修改后的最小均方差μt和Dt的逆计算结果如图(d)所示:
可以看到由于加强了对两个湍流系数的监督,求解湍流粘度和质量扩散系数的Multi-PINN方法的精度明显高于求解正问题的PINN方法。同时,通过调整损失函数中的权参数,Multi-PINN框架可以灵活地整合不同精度的物理信息,解决各种湍流传质问题。
文章结论
- 从仿真结果中选取5‰的数据点构成深度学习模型训练的观测数据集。以湍流粘度和质量扩散系数未知的未封闭机理模型作为训练的物理信息,这样的训练后的PINN能够在训练集区间内预测不同进口浓度下过程中的场。
- PINN还显示出一定的外推能力,能够以足够的精度预测训练集区间外的浓度分布。与传统的深度神经网络和基于湍流施密特数机制模型的模拟相比,PINN在不同空间坐标和边界条件下具有更强的泛化能力。
- 在计算效率方面,训练PINN框架所需的时间大约是求解单一工况(即进口浓度)机理模型所需的CFD模拟时间的8倍。然而,经过训练的PINN框架可以在任何给定的进口浓度条件下立即给出浓度场,这对于过程分析或优化等需要在各种操作条件下有效地进行物理场的多次模拟的情况是有价值的。
- 通过调整损失函数中物理信息与观测数据的权重比,本研究开发的PINN能够以适当的预测精度处理有噪声的观测数据。这表明,PINN对观测数据的精度要求较低,可以扩展到整合实验或低精度模型计算产生的数据。
-
嵌入在PINN训练中的物理信息不包括建模湍流粘度和质量扩散率的函数,而是作为训练后的PINN的预测输出获得这两个参数。这表明,本研究开发的PINN可以有效地用于这些参数的逆计算,以估计传统模型难以建模的参数。