论文笔记: 数据驱动的地震波形反演--健壮性与泛化性研究

闵帆

已于 2022-11-23 10:18:47 修改

阅读量593

点赞数 1

分类专栏：论文笔记文章标签：论文阅读

于 2022-11-16 16:27:26 首次发布

本文链接：https://blog.csdn.net/minfanphd/article/details/127886005

版权

论文笔记专栏收录该内容

29 篇文章 3 订阅

订阅专栏

摘要: 分享对论文的理解, 原文见 Zhongping Zhang and Youzuo Lin, Data-driven seismic waveform inversion: A study on the robustness and generalization.

1. 论文贡献

提供实时预测的 VelocityGAN
与其他基于编码器-解码器的数据驱动地震波形反演方法不同, VelocityGAN 从数据中学习正则化, 并进一步将正则化应用于生成器, 从而提高反演精度.
进一步使用迁移学习, 缓解泛化性问题.

2. 相关工作

图 1. 全波形反演的基本框架

图 1 展示了全波形反演的基本框架, 本质上就是端到端: 地震数据到速度模型.

2.1 声波反演: 物理驱动方法

正演模型为
$f(\mathbf{m}) \tag{1}$
其中 $\mathbf{m}$ 为速度模型参数 (一个向量), $f$ 为正演模型算子 (一个函数), $P$ 是声学情况下的压力波场.
正则化的物理驱动地震反演为
$E(\mathbf{m}) = \min_{\mathbf{m}} \{\|\mathbf{d} - f(\mathbf{m})\|_2^2 + \lambda R(\mathbf{m})\} \tag{2}$
其中 $\mathbf{d}$ 是实测的数据, $\| \cdot \|_2$ 是 2 范数, 相应部分表示数据匹配误差, $\lambda$ 为一个系数, $R(\mathbf{m})$ 是由参数导致的正则项, 用于避免模型太复杂 (过拟合).

这种方法的特点:

不需要其它数据的支持. 本质上, 输入只有 $\mathbf{d}$ ;
需要进行不断迭代求解. 预先猜一个模型 $\mathbf{m}$ 根据式 (3) 计算损失, 再根据该损失进行 $\mathbf{m}$ 的调整;
效率比较低 (与上一条有关);
依赖于初始猜测的模型, 即 $\mathbf{m}$ 的最初版本. 如果数据没有噪声, 可以获得非常好的效果. 否则会陷入局部最优解, 无法进行良好的拟合.

2.2 数据驱动: 学习反演算子

$\mathbf{m} = g(\mathbf{d}) = f^{-1}(\mathbf{d}) \tag{4}$
其中 $g$ 就是需要学习的反演算子.
$\argmin_g \left\{\sum_{i=1}^N \|\mathbf{m}_i - g(\mathbf{d}_i)\|_2^2\right\}\tag{5}$
其中 $\{\mathbf{d}_i, \mathbf{m}_i\}_{i=1}^N$ 为训练数据.

2.3 方法比较

表 1. 两种方法对比

	物理方法	数据驱动方法
数据	不需要其它数据的支持. 本质上, 输入只有 $\mathbf{d}$	需要训练数据 $\{\mathbf{d}_i, \mathbf{m}_i\}_{i=1}^N$
训练	针对当前数据的求解, 没有训练	大量训练时间, 效果与训练样本强相关
求解	需要进行不断迭代求解. 预先猜一个模型 $\mathbf{m}$ 根据式 (3) 计算损失, 再根据该损失进行 $\mathbf{m}$ 的调整	使用 $g$ 直接求解
效率	针对当前数据求解慢	训练慢, 但测试效率高
依赖	依赖于初始猜测的模型, 即 $\mathbf{m}$ 的最初版本. 如果数据没有噪声, 可以获得非常好的效果. 否则会陷入局部最优解, 无法进行良好的拟合	训练数据质量

3. 论文工作

图 2. VelocityGAN 框架

3.1 生成器

输入数据为一个 $32 \times 1000 \times 6$ 的张量
- 32 个接收器
- 1000 个时间点
- 3 个源函数 (从后文来说是 3 shots, 即相同位置放了 3 炮) 和 2 个通道 ( $\times 2 = 6$ )
标签为速度模型
- 大小为 $\times n$ , $m$ 表示深度, $n$ 表示水平距离
- 相邻点的距离为 $5$ m, 因此总的尺寸为 $5m \times 5n \textrm{ m}^2$
- 矩阵每个点的值表示声波的传播速度
网络细节
- 输入数据与标签之间, 并不存在空间的对应关系, 因此不会像平常的 U-Net 那样对它们的差异进行惩罚
- 使用多个 $\times 1$ 卷积统一到 $32 \times 32$
- 对 $32 \times 32$ 的数据使用 $\times 3$ 的卷积核, 直到获得 $\times 8$ 的数据
- 最后使用 $\times 8$ 的卷积核, 消除空间信息 (太狠了吧)
- 解码的时候, 逐步获得与速度模型相同大小 ( $\times n$ )

3.2 判别器

注重局部信息, 因此使用 patchCNN 而不是 GlobalCNN

小结

物理方法只在一个模型上迭代, 数据驱动方法从大量模型中学习, 所以会更容易跳出 (或者避免陷入) 局部最优解

闵帆

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
论文笔记: 数据驱动的地震波形反演--健壮性与泛化性研究

摘要: 分享对论文的理解, 原文见 Zhongping Zhang and Youzuo Lin, Data-driven seismic waveform inversion: A study on the robustness and generalization.
复制链接

扫一扫