DEEPXDE

最新推荐文章于 2025-04-22 10:00:00 发布

pinn山里娃

最新推荐文章于 2025-04-22 10:00:00 发布

阅读量7.4k

点赞数 19

分类专栏：物理驱动深度学习论文分享文章标签：神经网络

本文链接：https://blog.csdn.net/weixin_45521594/article/details/106336094

版权

物理驱动深度学习论文分享专栏收录该内容

40 篇文章

订阅专栏

论文信息

题目：DEEPXDE: A DEEP LEARNING LIBRARY FOR SOL VING DIFFERENTIAL EQUATIONS

作者：LU LU, XUHUI MENG, ZHIPING MAO, AND GEORGE EM KARNIADAKIS

期刊会议： Computational Physics，Machine Learning

年份：19

论文地址：代码：

基础补充

内容

动机

动机：

近年来在深度学习在计算机视觉，自然语言等方面得到了广泛应用，尽管在这些和相关领域取得了显著的成功，但深度学习还没有广泛应用于科学计算领域；
然而，最近，通过深度学习求解偏微分方程(PDEs)，如标准微分形式或积分形式，已经成为科学机器学习下一个潜在的新的子领域；
特别的，用一种近似于PDE解的神经网络来代替传统的数值离散方法

问题定义：求解微分方程
$f\left(\mathbf{x} ; \frac{\partial u}{\partial x_{1}}, \ldots, \frac{\partial u}{\partial x_{d}} ; \frac{\partial^{2} u}{\partial x_{1} \partial x_{1}}, \ldots, \frac{\partial^{2} u}{\partial x_{1} \partial x_{d}} ; \ldots ; \lambda\right)=0, \quad \mathbf{x} \in \Omega$

PINN

PPINN求解： $\mathcal{L}(\boldsymbol{\theta} ; \mathcal{T})=w_{f} \mathcal{L}_{f}\left(\boldsymbol{\theta} ; \mathcal{T}_{f}\right)+w_{b} \mathcal{L}_{b}\left(\boldsymbol{\theta} ; \mathcal{T}_{b}\right)$ 其中： $\begin{aligned} \mathcal{L}_{f}\left(\boldsymbol{\theta} ; \mathcal{T}_{f}\right) &=\frac{1}{\left|\mathcal{T}_{f}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{f}}\left\|f\left(\mathbf{x} ; \frac{\partial \hat{u}}{\partial x_{1}}, \ldots, \frac{\partial \hat{u}}{\partial x_{d}} ; \frac{\partial^{2} \hat{u}}{\partial x_{1} \partial x_{1}}, \ldots, \frac{\partial^{2} \hat{u}}{\partial x_{1} \partial x_{d}} ; \ldots ; \boldsymbol{\lambda}\right)\right\|_{2}^{2} \\ \mathcal{L}_{b}\left(\boldsymbol{\theta} ; \mathcal{T}_{b}\right) &=\frac{1}{\left|\mathcal{T}_{b}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{b}}\|\mathcal{B}(\hat{u}, \mathbf{x})\|_{2}^{2} \end{aligned}$

其中 $\mathcal{L}$ 为residual points，选择的策略可以为- 我们可以在训练开始时指定residual points，可以是格点上的网格点，也可以是随机点，训练过程中不改变它们；

在每次优化迭代中，我们可以随机选择不同的residual points；
我们可以在训练过程中自适应地改善residual points的位置(Residual-based adaptive refinement (RAR))。

特别注意：

因为L-BFGS使用损失函数的二阶导数，而Adam只依赖于一阶导数，所以L-BFGS可以找到比Adam迭代次数少的较好的解，但是对于 stiff solutions，L-BFGS更有可能被卡在一个糟糕的局部最小值上；
当residual points数目很大时，每一次迭代计算损失函数和梯度花费很大，可以考虑不使用所有residual points，把这些residual points分成一小批一小批，每次迭代只用一批，这种方法称为小批量梯度下降

PINN与NN对比目标： $f(x)=\sum_{k=1}^{5} \sin (2 k x) /(2 k) \text { in }[-\pi, \pi]$ 函数逼近:神经网络(NN)是低地频到高频学习目标函数的，但是PINNs的学习方式是所有频同时学习证明：使用PINN求解PDE比使用NN逼近函数要快
在这里插入图片描述

PINN与FEM比较
在这里插入图片描述

PINN逼近理论
在这里插入图片描述

说明：定理主要表明，具有足够神经元的前馈神经网络可以同时一致地逼近任意函数及其偏导数，就是存在可以求解PDE的神经网络

PINN误差分析
$\mathcal{E}:=\left\|\tilde{u}_{\mathcal{T}}-u\right\| \leq \underbrace{\left\|\tilde{u}_{\mathcal{T}}-u_{\mathcal{T}}\right\|}_{\mathcal{E}_{\mathrm{opt}}}+\underbrace{\left\|u_{\mathcal{T}}-u_{\mathcal{F}}\right\|}_{\mathcal{E}_{\mathrm{gen}}}+\underbrace{\left\|u_{\mathcal{F}}-u\right\|}_{\mathcal{E}_{\mathrm{app}}}$
其中： $\mathcal{F}$ 表示可以由我们选择的神经网络结构表示的所有函数的族
$u$ 是PDE的解
$u_{\mathcal{F}}$ 是 $\mathcal{F}$ 中最接近 $u$ 的函数
$u_{\mathcal{T}}$ ，因为训练是在 $\mathcal{T}$ 上
$\tilde{u}_{\mathcal{T}}$ ，优化器中求出的逼近解
$u_{\mathcal{F}}-u$ 是逼近误差
$u_{\mathcal{T}}-u_{\mathcal{F}}$ 是泛化误差
$\tilde{u}_{\mathcal{T}}-u_{\mathcal{T}}$ 是优化误差
在这里插入图片描述

PINN求解积分微分方程利用经典方法估计积分例如 Gaussian quadrature等方法，就在PINN中加入了一个新的discretization error $\mathcal{E}_{dis}$ 例如使用Gaussian quadratur方法： $\frac{d y}{d x}+y(x)=\int_{0}^{x} e^{t-x} y(t) d t$ 变换 $\int_{0}^{x} e^{t-x} y(t) d t \approx \sum_{i=1}^{n} w_{i} e^{t_{i}(x)-x} y\left(t_{i}(x)\right)$ 得到: $\frac{d y}{d x}+y(x) \approx \sum_{i=1}^{n} w_{i} e^{t_{i}(x)-x} y\left(t_{i}(x)\right)$
在这里插入图片描述

PINNs求解逆问题相比于forward增加了 $\mathcal{L}(\boldsymbol{\theta}, \boldsymbol{\lambda} ; \mathcal{T})=w_{f} \mathcal{L}_{f}\left(\boldsymbol{\theta}, \boldsymbol{\lambda} ; \mathcal{T}_{f}\right)+w_{b} \mathcal{L}_{b}\left(\boldsymbol{\theta}, \boldsymbol{\lambda} ; \mathcal{T}_{b}\right)+w_{i} \mathcal{L}_{i}\left(\boldsymbol{\theta}, \boldsymbol{\lambda} ; \mathcal{T}_{i}\right)$ 其中: $\mathcal{L}_{i}\left(\boldsymbol{\theta}, \boldsymbol{\lambda} ; \mathcal{T}_{i}\right)=\frac{1}{\left|\mathcal{T}_{i}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{i}}\|\mathcal{I}(\hat{u}, \mathbf{x})\|_{2}^{2}$

RAR(Residual-based adaptive refinement 基于残差的自适应细化)
问题：residual points通常是在域里面随机选择的，在大多数情况下都能表现得很好，但是，对于某些具有陡峭（steep）梯度的解的偏微分方程，它可能不是有效的，为了设计好residual point的分布，提出了RAR。
在这里插入图片描述
使用：

创新：提出RAR方法能够加速训练效率

实验

实验1：
$\begin{aligned} -\Delta u(x, y) &=1, \quad(x, y) \in \Omega \\ u(x, y) &=0, \quad(x, y) \in \partial \Omega \end{aligned}$
在这里插入图片描述

实验2：
$\begin{array}{ll} \frac{\partial u}{\partial t}+u \frac{\partial u}{\partial x}=\nu \frac{\partial^{2} u}{\partial x^{2}}, & x \in[-1,1], t \in[0,1] \\ u(x, 0)=-\sin (\pi x), & u(-1, t)=u(1, t)=0 \end{array}$
采用PINN和PINN（RAR）方法训练数据2540 个样本
在这里插入图片描述