摘要: 本贴从机器学习的角度来理解反射系数反演. 里面的数据都是瞎编的, 原理之类也是一知半解, 等地球科学专业人士来修改.
1. 问题的提出
反演是从观测数据推断实际地层信息的过程.
1.1 地层数据
图 1 展示了一个典型的假设地层信息模型. 典型的是速度模型, 即标出每个位置的传播速度. 传播速度也确定了地层的介质 (花岗岩, 泥土之类).
![](https://i-blog.csdnimg.cn/blog_migrate/ad8796da017af5e1f26d0048efadc86a.png)
1.2 观测数据
为了获得这个地层信息, 我们希望给这片区域打一个 CT. 于是在地面的一条直线上铺设了均匀 1000 个检波器, 在中间位置 Duang 地放了一炮. 以放炮时间为 0, 每个检波器在 1 s 内采集了 500 个数据, 每 2 ms 一个.
图 2 展示了一个观测数据. 它是使用正演模型, 从假设地层信息模型获得的. 也就是说, 放炮由计算机模拟.
![](https://i-blog.csdnimg.cn/blog_migrate/7281d7e8e1045bec65eb5d0f67fef2fb.png)
问题定义
输入: 地震波矩阵
V
∈
[
−
1
,
1
]
500
×
1000
\mathbf{V} \in [-1, 1]^{500 \times 1000}
V∈[−1,1]500×1000, 各元素已经归一化.
输出: 反射系数矩阵
R
∈
[
−
1
,
1
]
500
×
1000
\mathbf{R} \in [-1, 1]^{500 \times 1000}
R∈[−1,1]500×1000,
2. 数据的特点
- 稀疏性.
- 地层数是很少, 通常在 20 层之内.
- 地层有一定间隔.
- 连续性.
- 相邻道同一时间或相邻时间的反射系数是连续的.
- 特殊情况
- 断层不满足完全的连续性. 但它要么左连续, 要么右连续.
- 地层粘连. 导致稀疏性假设不成立, 这种情况可以根据连续性假设来校正.
3. 可能的方法
这里只讨论神经网络的方法. 为方便起见, 训练数据由模型生成, 这样我们就有标签.
从机器学习的角度来看, 我们可以根据数据的特点定义相应的惩罚项、正则项, 这样就不会将它们作为硬性的约束条件.
3.1 针对单道的 CNN
单道数据比较简单.
3.1.1 数据生成
数据生成的注意事项:
- 考虑稀疏性, 控制层数和层的间隔. 图 3 不满足层间隔假设.
- 生成的噪音不应太大. 图 4 的噪音还可以. 如果噪音强得人都识别不出来了, 意义也不大.
![](https://i-blog.csdnimg.cn/blog_migrate/e00176baf232b1e551f8607dcf9113dd.png)
![](https://i-blog.csdnimg.cn/blog_migrate/453cb4fda2c1d782c81cc740eff07744.png)
3.1.2 模型训练
使用 CNN 模型时, 应充分利用稀疏性. 具体怎么弄我也不知道, 也不是我的事儿.
3.2 针对单炮的 CNN
实际上, 单炮数据才能充分展示数据的特点, 以及两种特点的互补性.
3.1.1 数据生成
数据生成的注意事项:
- 考虑连续性.
未完待续