Failure-informed adaptive sampling for PINNs Part II combining with resampling and subset simulation

最新推荐文章于 2025-04-24 22:21:31 发布

xuelanghanbao

最新推荐文章于 2025-04-24 22:21:31 发布

阅读量314

点赞数 1

分类专栏：论文阅读文章标签：算法论文阅读 python 神经网络人工智能

本文链接：https://blog.csdn.net/qq_26157437/article/details/131886208

版权

论文阅读专栏收录该内容

31 篇文章

订阅专栏

文章介绍了AFI-PINN框架，该框架通过自适应采样和子集模拟改进了PINNs的训练过程，解决了FI-PINN训练点不可控的问题。AFI-PINN在训练损失不再下降时进行重采样，并使用退火策略动态调整重采样比例，确保训练效率和成本。子集模拟用于估计失败概率，通过嵌套的失败区域逐步逼近真实失败概率。实验表明，这种方法提高了训练效果和收敛速度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文阅读：Failure-informed adaptive sampling for PINNs, Part II: combining with re-sampling and subset simulation

Failure-informed adaptive sampling for PINNs, Part II: combining with re-sampling and subset simulation
总结

Failure-informed adaptive sampling for PINNs, Part II: combining with re-sampling and subset simulation

Annealing failure-informed PINNs

上回说到，FI-PINN会在训练过程中不断往训练集中增加训练点，并不能人为限制训练点的数量，这就使得训练过程变得不可控，同时难以预计训练所要花费的时间。作者受到R3 Sampling的影响，提出了AFI-PINN。

AFI-PINN 框架分为两个阶段。首先是确定何时更新训练集，这称为重启阶段。第二个是具体如何对点进行重采样。对于第一阶段，一个简单的解决方案是定期交换点，即在整个训练过程中每经过给定数量的epoch就重新采样。作者在本文中采取的做法是，当训练损失在几个时期内不再减少时，就对搭配点进行重新采样。

比较特殊的是使用退火方式的自适应采样过程。当需要在第 $T_\text {restart}$ 个epoch重新采样时，首先使用采样方法（例如上回使用的 SAIS 方法或下文中使用的子集模拟）估计失败概率 $\hat P_F$ ，并同时从故障区域生成 $N_F$ 个搭配点组成的候选点集 $D_\text{adaptive}$ 。如果失败概率 $\hat P_F$ 小于预定义的容差 $\rho$ ，则可以提前终止整个训练。否则就要使用余弦退火方法更新训练点。具体来说，新的训练集将由三部分组成：自适应搭配数据集 $D_\text{adaptive}$ 、从初始数据集 $D_c$ 生成的大小为 $N_c(1 − \eta)$ 的预选数据集 $\hat D_c$ ，以及从先验分布中生成大小为 $\eta N_c − N_F$ 的新数据集 $D_\text{prior}$ 。

其中， $\eta < 1$ 是重采样比例。通过这样的方法，就可以使更新后数据点的数量保持不变。其中，包含预选点的原因是网络需要保留之前训练中学到的特征。而自适应样本和先验样本有助于支持网络分别从故障区域和问题域的其他部分学习新特征。这种类型的组合将极大地提高训练效率，同时还降低计算成本并加快收敛速度。

为了确定重采样比例 η，作者使用了基于重新启动和最大训练轮数的余弦退火方式。通过这个方法可以自适应地选择数据集的比例，以保持新数据集不同部分之间的平衡。具体来说，假设第 $k$ 个重新采样时期为 $T^{(k)}_\text{restart}$ ，总训练轮数为 $T_\text{max}$ 。当重新采样时，比例可以计算为：
$\eta=a\left(1+b\cos\left(\frac{\pi(T_{restart}^{(k)}-T_{s}^{(k)})}{T_{max}-T_{s}^{(k)}}\right)\right)$
其中， $a$ 和 $b$ 是两个正数，用来控制采样比例的上下界， $T^{(k)}_s$ 为上一次重新采样时的轮数，即 $T^{(k)}_s = T^{(k-1)}_\text{restart}$

在这里插入图片描述

上图展示了训练过程中比例的趋势，其中 $\eta 1 = a(1 + b) \in (0, 1)$ ， $\eta 2 = a(1 − b) \in (0, 1)$ 。当 $N_F < N_c\eta \coloneqq N_s$ 时，可以从先验中抽取 $N_s − N_F$ 个样本，记为 $D_\text{prior}$ 。否则，可以通过从候选自适应数据集中抽取 $N_s$ 个样本来构建自适应样本。在这种情况下， $D_\text{prior} = \oslash$ 。

完整算法如下：

在这里插入图片描述

子集模拟

作者在文章中采用基于MCMC方法的子集模拟（SS）来完成自适应采样。 SS 是最常用的方差减少技术之一，作者在本文中用其估计失效概率 $\hat P_F$ 。子集模拟的主要思想是定义一系列嵌套的失败区域，其中包括目标失败区域 $\Omega_F$
$\Omega_F \subset \Omega_{F_m} \subset \Omega_{F_{m-1}} \subset \dots \Omega_{F_1} \subset \Omega_{F_0} = \Omega$
于是，失败概率可以被分解如下：
$P_F = P(\Omega_F)=P(\Omega_{F_1}|\Omega_{F_0})P(\Omega_{F_2}|\Omega_{F_1})\dots P(\Omega_{F_m}|\Omega_{F_{m-1}})P(\Omega_{F}|\Omega_{F_m})$
其中， $P(\Omega_{F_{k+1}}|\Omega_{F_k})= \frac{P(\Omega_{F_{k+1}})}{P(\Omega_{F_{k}})}, 0 \le k \le m-1$ 表示中间区域 $\Omega_{F_m}$ 中失败概率的条件概率， $P(\Omega_{F}|\Omega_{F_m})$ 表示最终的条件概率。

在子集模拟的过程中，中间区域失败的条件概率被设定为一个固定值 $\rho \in (0,1)$ 。假设 $N_p = N_s \rho$ 与 $\rho ^{-1}$ 均为正数，那么， $N_p$ 就是马尔科夫链的数量， $\rho ^{-1}$ 就是每个链的采样数目。作者根据其他SS文献，将 $\rho$ 设置为了 $0.1$ 。采样数目 $N_s$ 则控制着结果的精度。具体来说，子集模拟首先从无条件概率开始生成 $N_s$ 。使用直接蒙特卡罗方法从先验分布 $\omega (x)$ 获取 $x$ 个样本。计算相应的 $Q$ 值并按降序排列，得到一个有序列表 $S_0 = \{x^{(i)}_0 \}^{N_s}_{i=1}$ ，此时，中间失效区域为 $ \Omega_{F_1} \coloneqq {x : Q(x) >\epsilon ^{(1)}_r }$，其中 $\epsilon ^{(1)}_r$ 为 $x$ 在第 0 次中第 $N_p + 1)$ 大样本值，即 $\epsilon ^{(1)}_r = x^{(N_p+1)}_0$ 。以此类推，可以得到第 $k + 1$ 次时中间失败区域表示如下：
$\Omega_{F_{k+1}} \coloneqq \{x : Q(x) >\epsilon ^{(k+1)}_r \}$
于是，条件概率 $P(\Omega_{F_{k+1}}|\Omega_{F_k})$ 可以表示如下：
$\mathcal{P}(\Omega_{\mathcal{F}_{k+1}}|\Omega_{\mathcal{F}_{k}})=\int_{\Omega_{\mathcal{F}_{k+1}}}\rho(\mathbf{x}|\Omega_{\mathcal{F}_{k}})d\mathbf{x}\approx\frac{1}{N_{s}}\sum_{i=1}^{N_{s}}\mathcal{I}_{\Omega_{\mathcal{F}_{k+1}}}(\mathbf{x}_{k}^{(i)})=p.$
值得注意的是，样本 $\{x^{(i)}_k \}^{N_p}_{i=1}$ 也遵循条件密度 $\rho(\cdot|\Omega_{\mathcal{F}_{k+1}})$ 。因此，为了保持样本大小恒定，需要从 $\rho(\cdot|\Omega_{\mathcal{F}_{k+1}})$ 生成最终的 $N_s − N_p)$ 样本。在实践中，修改后的Metropolis Hasting算法（MMA）可用于生成初始种子 $\{x^{(i)}_k \}^{N_p}_{i=1}$ 的 $N_p$ 条链。在采样过程中，每个链将接受 $ \frac 1 p − 1$ 个新样本。因此，新的样本集 $S_{k+1}$ 可以表示为 $\{\mathbf{x}_{k+1}^{(i)}\}_{i=1}^{N_{s}}=\{\mathbf{x}_{k+1}^{(i)}\}_{i=1}^{N_{s}-N_{p}}\cup\{\mathbf{x}_{k}^{(i)}\}_{i=1}^{N_{p}}$

不断重复上述过程，第 $k$ 次时失败区域的样本数量可以表示为：
$N_{\mathcal{F}_k}=\sum_{i=1}^{N_s}\mathcal{I}_{\Omega_{\mathcal{F}}}(\mathbf{x}_k^{(i)}).$
如果 $N_p > N_{F_k}$ ，因为中间失效区域接近真实失效区域，则可以终止仿真。如果模拟在 $k = m$ 处结束，则条件概率 $P(\Omega_{F}|\Omega_{F_m})$ 可以估计为:
$\mathcal{P}(\Omega_{\mathcal{F}}|\Omega_{\mathcal{F}_{m}})=\int_{\Omega_{\mathcal{F}}}\rho(\mathbf{x}|\Omega_{\mathcal{F}_{m}})d\mathbf{x}\approx\frac{1}{N_{s}}\sum_{i=1}^{N_{s}}\mathcal{I}_{\Omega_{\mathcal{F}}}(\mathbf{x}_{m}^{(i)})=\frac{N_{\mathcal{F}_{m}}}{N_{s}}:=q$
此时，失败概率可作如下估计：
$\begin{aligned}P_{\mathcal{F}}&=\mathcal{P}(\Omega_{\mathcal{F}_1}|\Omega_{\mathcal{F}_0})\mathcal{P}(\Omega_{\mathcal{F}_2}|\Omega_{\mathcal{F}_1})\cdots\mathcal{P}(\Omega_{\mathcal{F}_m}|\Omega_{\mathcal{F}_{m-1}})\mathcal{P}(\Omega_{\mathcal{F}}|\Omega_{\mathcal{F}_m})\\&\approx p^mq=\hat{P}_{\mathcal{F}}^{SS}.\end{aligned}$
完整算法如下：

在这里插入图片描述

实验结果

作者在具有两个和四个峰值的二维问题、一个瞬态波动方程和一个十维泊松方程共四个样例上测试了R-FIPINN（基于残差的）、G-FIPINN（基于残差梯度的）。

The time-dependent wave equation

$\begin{aligned} &\frac{\partial^{2}u}{\partial t^{2}}-3\frac{\partial^{2}u}{\partial x}^{2}=0,\quad(t,x)\in[0,6]\times[-5,5], \\ &u(0,x)=\frac{1}{\cosh(2x)}-\frac{0.5}{\cosh(2(x-10))}-\frac{0.5}{\cosh(2(x+10))}, \\ &\frac{\partial u}{\partial t}(0,x)=0,, \\ &u(t,-5)=u(t,5)=0, \end{aligned}$

其精确解为：
$\begin{aligned}u(t,x)&=\frac{0.5}{\cosh(2(x-\sqrt3t))}-\frac{0.5}{\cosh(2(x-10+\sqrt3t))}\\&+\frac{0.5}{\cosh(2(x+\sqrt3t))}-\frac{0.5}{\cosh(2(x+10-\sqrt3t))}.\end{aligned}$
在这里插入图片描述