文献总结：Learning nonlinear operators for identifying differential equations(DeepONet)

Zion__

已于 2024-04-24 20:23:30 修改

阅读量559

点赞数 12

文章标签：神经网络人工智能深度学习

于 2024-04-24 20:20:53 首次发布

本文链接：https://blog.csdn.net/Zion__/article/details/138168710

版权

首先我们有算子的万有逼近定理：截屏2024-04-24 18.46.32

可以用一个神经网络来描述它：截屏2024-04-24 18.45.51

称上述神经网络是堆叠的DeepONet.它以y为输入，输出 $[t_1,t_2,\cdots,t_p]^T\in \mathbb{R^p}$ ，除了Trunk网络，还有p个branch网络，每个网络都以 $[u(x_1),u(x_2),\cdots,u(x_m)]^T$ 为输入，并输出一个标量 $b_k\in\mathbb{R}$ .我们把他们合起来即为：截屏2024-04-24 18.54.49

在实践中，p至少是10阶，而且使用许多分支网络是低效的。因此我们将所有分支网络合并为一个单个分支网络，也就是单个分支网络输出向量 $[b_1,b_2,\cdots,b_p]^T\in\mathbb{R}^p$ .这样得出的网络称为非堆叠的DeepONet，该网络可以被视为所有分支网络共享同一组参数的堆叠DeepONet，其中非堆叠的DeepONet的数学依据是如下的定理：截屏2024-04-24 18.59.54 其中 $<,\cdot,>$ 表示 $\mathbb{R}^p$ 中的点乘运算，g和f可以选择不同类别的神经网络，如全连接神经网络，残差神经网络和卷积神经网络。网络结果如下图所示：截屏2024-04-24 19.02.29

也即，DeepONet时一种网络架构，没有定义其内部（主干和分支）的具体神经网络形式.接下去的几个例子都是选择最简单的全连接网络作为子网络架构，如果输入函数有一定的结构，那么可以用专门的层：例如，如果 $\{x_1,x_2,\cdots,x_m\}$ 在等间距的网格上，那么可以在Branch net中用卷积层。

那么数据怎么得到呢？首先数据点是三元组(u,y,G(u)(y))因此特定的输入u可能出现在具有不同y值的多个数据点中，例如，大小为1w的数据集可能仅从100个输入u得到，每个数据集在100个不同的y位置处评估G(u)(y).从来在数据集中，对于每个u，就在G(u)的定义域中随机选择P个不同的y点，因此数据点的总数是P $\times$ #u.同时在DeepONet中，我们使用 $[u(x_1),u(x_2),\cdots,u(x_m)]$ 作为分支网络的输入来表示u(x)，所以我们也要估计需要多少个m来实现良好的精度 $\epsilon$ 。