多尺度（有限元）降阶模型下的DNN方法

最新推荐文章于 2025-04-13 23:51:30 发布

陆嵩

最新推荐文章于 2025-04-13 23:51:30 发布

阅读量7.3k

点赞数 8

分类专栏：数学原理数据科学与人工智能计算数学文章标签： multiscale FEM DNN observed data reduced order

本文链接：https://blog.csdn.net/lusongno1/article/details/86496791

版权

计算数学同时被 3 个专栏收录

167 篇文章

订阅专栏

数学原理

116 篇文章

订阅专栏

数据科学与人工智能

57 篇文章

订阅专栏

多尺度模型的DNN解法

今天，想和大家分享的是Eric Chung的三篇文章。Deep Multiscale Model Learning、Deep Global Model Reduction Learning、Prediction of Discretization of GMsFEM using Deep Learning。

Eric是港中文（The Chinese University of Hong Kong ）的一个教授，曾经也来访过我们所做过报告，它的工作主要是关于CFD的。

某种意义上来说，这三篇文章是“一样”的。我会比较详细地介绍第一篇文章，后面的，我只会介绍不同的地方。

这里仍然有许多我不懂的地方，在我读文章的时候，毕竟，我对多尺度方法知之甚少。

NLMC&DNN（DMML，Deep Multiscale Model Reduction Learning）

众所周知，DNN可以表示一个非线性函数，我们所在意的是输入是什么，输出是什么，DNN的结构是什么，以及我们用来训练网络的数据。

在第一篇文章中，作者使用NLMC作为多尺度模型，NLMC是non-local multi-continuum approach的缩写。它定义了一个新的基函数，以使得自由度有了物理意义，什么物理意义呢？那就是“解的平均”。

在另一方面，我们可以将DNN用来求解PDE和进行模型的约化。

在这篇文章中，作者联合了两种方法学，制作了一个DNN网络，和多尺度模型约化概念相关。这个大大减小了计算复杂度。另外，作者还比较了用不同比例（proportion）的观测数据和计算数据用于训练的结果。

OK，让我们开始这一部分。

一般来说，我们研究：

在这里插入图片描述

这里的 $I$ 表示输入，包括介质属性：渗透场（permeability field）、源项（well rates），初始条件。

考虑一个特殊的情况，就是一个特殊的扩散方程，如下：

在这里插入图片描述

它的边界条件是零纽曼边界条件，即 $\nabla u \cdot n = 0$ 。

使用标准的有限元方法，时间离散上，采用后向欧拉格式（backward Euler），我们可以得到：

在这里插入图片描述

这里的下标（subscript） $f$ 表示细网格上的细尺度（fine-scale）解。
写成矩阵的形式，我们有：

在这里插入图片描述

$M_f$ 表示质量（mass）矩阵， $A_f$ 表示刚度（stiffness）矩阵， $b_f$ 是右手边的那个向量。

以上说的是，经典的有限元方法。什么是NLMC？

我们将区域D分割为matrix region和fractures region。即：

在这里插入图片描述

这里，这些符号在原文中的解释是：

在这里插入图片描述

我并不是太明白这个，特别是什么是 $d_i$ 。接下来，我们定义oversampling of 粗网格单元 $K_i$ as $K_i^+$ 。

在这里插入图片描述

然后，我们可以得到基函数 $\psi_m^{(i)}$ ，通过求解如下一个约束（constraint）极小化问题：

在这里插入图片描述

定义传递（transmissbility）矩阵T，如下：

在这里插入图片描述

写成如下形式：

在这里插入图片描述

最后我们可以得到NLMC的一个upscale model：

在这里插入图片描述

NLMC的优点在于，其一是我们能得到一个更精确的解，其二，粗网格解有重要的物理意义，也就是块中的平均压力。

下面，我将介绍，如何联合NLMC方法和DNN。

首先，使用NLMC方法去求解问题得到解：

在这里插入图片描述

我们的目标是得到一个DNN，写成如下：

在这里插入图片描述

这里的 $I^n$ 是一些输入参数，比如说源项等。

可以使用之前得到的解去训练网络。这里花写的 $N$ ，在每一个时刻（time instant）可以是相同：

在这里插入图片描述

也可以是不同的：

在这里插入图片描述

我们也可以从影响域（region of infulence）中去寻找神经网络的输入，它告诉了我们合适的输入变量的数目。传递矩阵（tansmissibility）给了我们一些信息关于粗参数直接的连接。

我不是特别清楚怎么做的。但是，In a word， NLMC模型的影响域给我们提供了一些连接信息关于神经网络，并且减少了神经网络的复杂度且提供了一个好的初始的权重矩阵，如图所示：

在这里插入图片描述

在这篇文章中，作者还试图加入”观测数据“来改进这个降阶模型。所谓的观测数据，主要来自于：1、pertburb仿真数据；2、perturb渗透率（permeability），重跑仿真得到数据；3、可得到的实验数据。

一般来说，观测数据是非常难以得到的。所以，作者综合仿真数据和观测数据来训练神经网络，包括：观测数据only，仿真数据only，两者混合。

结论是，incorporating观测数据在训练中会改进结果，incorporating一些计算数据会改进预测。

POD&DNN（Proper Orhogonal Decomposition）

接下来，我要介绍得是第二篇文章。许多东西和第一篇文章是一样的，我只介绍不一样的地方。

我们考虑的模型问题是，在区域 $\Omega = [0,1]^2$ 中，考察方程：

在这里插入图片描述

在我们的仿真中，我们会考虑一种指数模型， $\kappa(x,u)=\kappa(x)\text{exp}(\alpha u)$ ，这里的 $u$ 是流体的压力， $g$ 是个时间依赖（time-dependent）的源项， $\alpha$ 是一个非线性参数。在这项工作中，作者考虑渗透（permeability）场包含wavelet-like的通道，如图：