Physics-informed neural networks for inverse problems in nano-optics and metamaterials论文笔记

最新推荐文章于 2025-03-19 16:42:08 发布

pinn山里娃

最新推荐文章于 2025-03-19 16:42:08 发布

阅读量790

点赞数 7

分类专栏：物理驱动深度学习论文分享文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_45521594/article/details/106334451

版权

物理驱动深度学习论文分享专栏收录该内容

40 篇文章

订阅专栏

本文介绍了物理信息神经网络(PINNs)在解决纳米光学和超材料领域的复杂逆问题方面的最新进展。PINNs提供了一种解决偏微分方程的通用框架，尤其适用于强多光散射条件下的逆问题。文中详细阐述了PINNs如何通过最小化由初始点、边界点和方程残差构成的损失函数来估计未知参数，并展示了在不同实验场景下的应用效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文信息

题目：Physics-informed neural networks for inverse problems in nano-optics and metamaterials

作者：Yuyao Chen, Lu Lu, George Em Karniadakis, and Luca DPal Negro

期刊会议：Computational Physics

年份：19

论文地址：

代码：

内容

动机

动机：- 在强多光散射条件下，复杂多粒子几何中物理驱动的光散射微分模型的逆问题成为一个本质上不定的问题，利用传统方法不能满足预测需求- 物理信息神经网络(PINNs)是近年来发展起来的一个通用框架，用于解决偏微分方程的正问题和反问题- PINN仅使用一个训练数据集来实现所需的解决方案，从而减轻了替代方案中所需的大量训练数据集所带来的负担

问题定义：逆问题：
$f\left(\mathbf{x} ; \frac{\partial \hat{u}}{\partial x_{1}}, \ldots, \frac{\partial \hat{u}}{\partial x_{d}} ; \frac{\partial^{2} \hat{u}}{\partial x_{1} \partial x_{1}}, \ldots, \frac{\partial^{2} \hat{u}}{\partial x_{1} \partial x_{d}} ; \ldots ; \lambda\right)=0, \quad \mathbf{x} \in \Omega$
其中 $\lambda$ 未知，其中loss定义为， $\mathcal{L}_{i}$ ，是初始点的 $l o s s$ , $\mathcal{L}_{b}$ 是边界点的 $l o s s$

$\mathcal{L}(\boldsymbol{\theta}, \lambda)=w_{f} \mathcal{L}_{f}\left(\boldsymbol{\theta}, \lambda ; \mathcal{T}_{f}\right)+w_{i} \mathcal{L}_{i}\left(\boldsymbol{\theta}, \lambda ; \mathcal{T}_{i}\right)+w_{b} \mathcal{L}_{b}\left(\boldsymbol{\theta}, \lambda ; \mathcal{T}_{b}\right)$ 其中 $\begin{aligned}\mathcal{L}_{f}\left(\boldsymbol{\theta}, \lambda ; \mathcal{T}_{f}\right) &=\frac{1}{\left|\mathcal{T}_{f}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{f}}\left\|f\left(\mathbf{x} ; \frac{\partial \hat{u}}{\partial x_{1}}, \ldots, \frac{\partial \hat{u}}{\partial x_{d}} ; \frac{\partial^{2} \hat{u}}{\partial x_{1} \partial x_{1}}, \ldots, \frac{\partial^{2} \hat{u}}{\partial x_{1} \partial x_{d}} ; \ldots ; \lambda\right)\right\|_{2}^{2} \\\mathcal{L}_{i}\left(\boldsymbol{\theta}, \lambda ; \mathcal{T}_{i}\right) &=\frac{1}{\left|\mathcal{T}_{i}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{i}}\|\hat{u}(\mathbf{x})-u(\mathbf{x})\|_{2}^{2} \\\mathcal{L}_{b}\left(\boldsymbol{\theta}, \lambda ; \mathcal{T}_{b}\right) &=\frac{1}{\left|\mathcal{T}_{b}\right|} \sum_{\mathbf{x} \in \mathcal{T}_{b}}\|\mathcal{B}(\hat{u}, \mathbf{x})\|_{2}^{2}\end{aligned}$

根据PINN构建如下网络：建立微分方程解的代理模型，在更加 $u$ 求得 $l o s s$ ，最后最小化 $l o s s$ 求得参数 $\theta$ 和 $\lambda$

PINNS for the homogenization of finite-size metamaterials(超材料)

（没有明确边界条件）
忽略有效介质中的辐射损失
具体应用于均质有限尺寸的超材料问题：

$\nabla^{2} E_{z}(x, y)+\varepsilon_{r}(x, y) k_{0}^{2} E_{z}=0$

其中 $E_{z}$ 是电厂的z分量， $\varepsilon_{r} (x, y)$ 是空间相关的相对介电常数, $k=2\pi /\lambda_{0}$ 求解 $\varepsilon_{r} (x, y)$ 相当于参数 $\lambda$

实验1(阵列中散射纳米线的周期性排列)：
在这里插入图片描述
结果：预测与真实误差7%，通过得到的电容率常数，用FEM仿真得到整个 $E_{z}$ 分布，与真实误差为2.82%

实验2(阵列中散射纳米线的周期性排列)：
将实验1的 $\epsilon$ 改为12
在这里插入图片描述
结果：得到的真实与预测 $E_{z}$ 误差5%

实验3（任意非周期形态的散射阵列）
问题：沃格尔螺旋阵列（Vogel spiral array）极坐标下参数方程定义：
$\left\{\begin{array}{l}r_{n}=a_{0} \sqrt{n} \\\theta_{n}=n \alpha\end{array}\right.$
在这里插入图片描述
结果：误差3.8%

存在多散射介质中的辐射损失
问题：

实验：考虑存在多散射介质中的辐射损失应用于前面1，2，3实验中，得到 $\operatorname{Im}\left\{\varepsilon_{r}(x, y)\right\}$ 为 $10^{-4}$ ,0.6和0.3, $\operatorname{Re}\left\{\varepsilon_{r}(x, y)\right\}$ 误差非常都接近，3%

创新：论文中提出的一般的PINNs框架适用于研究任意非周期有效介质和超材料中形态和辐射耦合的影响，超越了有效介质理论的限制。

PINN for inverse MIE scattering （有明确的边界条件）

创新：PINNs框架可以用于从近场成像数据中检索复杂纳米结构的光学特性

实验1：
问题： $\left\{\begin{array}{l}\nabla^{2} E_{z}^{(k)}+\varepsilon_{r k} k_{0}^{2} E_{z}^{(k)}=0 \quad \text { in } \Omega_{k},(k=1,2) \\\left.E_{z}^{(1)}\right|_{r=a}=\left.E_{z}^{(2)}\right|_{r=a} \\\left.\frac{1}{\mu_{r 1}} \frac{\partial E_{z}^{(1)}}{\partial r}\right|_{r=a}=\left.\frac{1}{\mu_{r 2}} \frac{\partial E_{z}^{(2)}}{\partial r}\right|_{r=a}\end{array}\right.$

其中 $E_{z}^{(1)}, E_{z}^{(2)}$ 表示电场z分量的分别nanocylinder的内部和外部实部，实验中设置 $\varepsilon_{r 2}=1$ 而 $\varepsilon_{r 1}$ 为需要训练的参数
在这里插入图片描述
结果：误差0.51%

实验2：多参数问题：
$\left\{\begin{array}{l}\nabla^{2} E_{z}^{(k)}+\varepsilon_{k} k_{0}^{2} E_{z}^{(k)}=0 \quad \text { in } \Omega_{k},(k=1,2,3) \\\left.E_{z}^{(1)}\right|_{r=a}=\left.E_{z}^{(2)}\right|_{r=a},\left.\quad E_{z}^{(2)}\right|_{r=b}=\left.E_{z}^{(3)}\right|_{r=b} \\\left.\frac{1}{\mu_{i}} \frac{\partial E_{z}^{(1)}}{\partial r}\right|_{r=a}=\left.\frac{1}{\mu_{c}} \frac{\partial E_{z}^{(2)}}{\partial r}\right|_{r=a},\left.\quad \frac{1}{\mu_{c}} \frac{\partial E_{z}^{(2)}}{\partial r}\right|_{r=b}=\left.\frac{1}{\mu_{0}} \frac{\partial E_{z}^{(3)}}{\partial r}\right|_{r=b}\end{array}\right.$
在这里插入图片描述