《地球物理人工之智能和信息前沿技术学术报告会》
主讲人:陆文凯
1. 地球物理学
- 地球科学的主要学科之一,是通过定量的物理方法(如:地震、重、磁、电、测井、地热和放射能等方法)研究地球以及寻找地球内部矿藏资源的一门综合性学科,研究范围包括地球的地壳、地幔、地核和大气层。
- 不同的地球物理方法探测地球不同的物理性质。不同的地球物理方法能够探测地球表面以下物性(密度、磁化率、电阻率和速度等)结构的差异,被广泛应用于产勘探、油气开发和地质构造研究等领域。
- 地球物理要解决病态问题。地震采集+地震处理:看得清,看得准;地震解释:看得懂。
2. ES的总体理念与策略
2.1 利用AI提升解决病态的地球物理问题的能力
- 更高精度和可靠性、更好外推性
- 更强的多元信息融合和多任务联合处理能力
- 更少人工
2.2 数据驱动+知识驱动+多元信息
- 地球物理模型+其他物理模型
- 传统的处理解释方法和结果
- 处理与解释的经验
- 定性的认识,如地质认识,多任务相关性
- 等等
3. 基于人工智能的多元信息相容性表达
- 地震数据、地震成像速度、地质模式、测井数据都是对同一地下目标体的不同尺度的表征。
- 传统的地震反演成像技术利用正则化技术来引入地质与测井的统计约束,通常采用简单的数学模型假设,而没有充足的地质证据,只能增强反演成像过程的稳定性,无法准确地反映千变万化的地质规律。
- 研究一种深度网络框架,实现地震数据、地震成像速度、地质模式、测井数据之间的自动转换。
4. 基于地球物理模型的数据集生成
- 挑战:地震数据多,标签数据少
- 人工合成数据集
- 基于实际数据的数据集生成策略
- 创新点:实际数据驱动的样本生成——突破深度网络缺乏训练样本的瓶颈。
- 传统方法和智能方法不是“打擂台”,而是相互赋能。
5. 基于深度学习的地震噪声压制
- 深度学习方法应用于实际地震数据时面临的主要问题
- 本方法解决的主要问题:1.如何生成训练过程需要的数据集;2.如何在上述数据集下训练得到去噪性能优异的网络
5.1 基于伪训练集生成和迭代进化策略的训练框架
- 数据进化:生成数据集,更适应实际数据去噪
- 如图所示,1.对含噪数据进行强去噪得到噪声残留少的预测信号 X w ′ X'_w Xw′;2.对含噪数据进行弱去噪得到有效信号少的预测噪声 N W ′ N'_W NW′;3.基于 X S ′ X'_S XS′、 N W ′ N'_W NW′合成伪训练样本对 ( Y i n p u t , X l a b e l ) (Y_{input},X_{label}) (Yinput,Xlabel)
- 含噪输入: Y i n = α × X S ′ + β × N W ′ Y_{in} = \alpha \times X'_S +\beta \times N'_W Yin=α×XS′+β×NW′
- 伪标签: X l a b e l = α × X S ′ X_{label} = \alpha \times X'_S Xlabel=α×XS′
- α ∈ [ 0.9 , 1.1 ] \alpha \in [0.9, 1.1] α∈[0.9,1.1] , β ∈ [ 0.5 , 2 ] \beta \in [0.5, 2] β∈[0.5,2]
5.1.1
- 基于现有去噪算法 f 0 ( ∗ ) f_0(*) f0(∗) 生成伪训练集 t r a i n s e t 0 trainset_0 trainset0,通过弱监督学习方法得到网络模型 f 1 ( ∗ ) f_1(*) f1(∗);
- 由于网络模型 f 1 ( ∗ ) f_1(*) f1(∗)的去噪性能优于生成伪训练集的算法 f 0 ( ∗ ) f_0(*) f0(∗),因此借助 f 1 ( ∗ ) f_1(*) f1(∗)更新伪训练集得到 t r a i n s e t 1 trainset_1 trainset1;
- 基于更新的伪训练集重新训练网络得到 f 2 ( ∗ ) f_2(*) f2(∗);
- 重复上述步骤的第二、三步,对伪训练集和网络参数进行迭代进化,最终得到性能优异的去噪网络
f
∗
(
∗
)
f^*(*)
f∗(∗)。
6. 基于频间形态相似性与自编码鲁棒重构的面波盲分离
6.1 定性认识:空间模式相似性
- 面波干扰只占据低频的窄频带,高频部分不受面波影响。
- 利用无面波频率分量与含面波低频分量的频间空间模式相似性,对混合信号中的有效波进行提取。
6.2 方法技术原理
- 总体流程图
- 利用地震资料频间形态相似性,通过中频信号获取伪低频信号:
- 1.预处理
- 2.分频处理: y = y L + y M + y H y= y_L + y_M + y_H y=yL+yM+yH y L = x L + n y_L = x_L+n yL=xL+n y y y 表示信号, y L , y M , y H y_L,y_M,y_H yL,yM,yH表示信号的低、中、高频部分, n n n表示面波干扰
- 3.伪低频信号获取:
R
M
=
H
i
l
b
e
r
t
(
y
M
)
R_M =Hilbert(y_M)
RM=Hilbert(yM)
R
M
a
=
y
M
+
i
R
M
R_{Ma} = y_M + i_{RM}
RMa=yM+iRM
e
n
v
=
a
b
s
(
R
M
a
)
=
R
M
2
+
y
M
2
env=abs(R_{Ma}) = \sqrt{R_M^2 + y_M^2}
env=abs(RMa)=RM2+yM2
R
L
t
e
m
p
=
L
o
w
P
a
s
s
(
e
n
v
,
f
L
)
R_{Ltemp}=LowPass(env, f_L)
RLtemp=LowPass(env,fL)
l
o
w
=
A
v
e
r
a
g
e
F
i
l
t
e
r
(
R
L
t
e
m
p
)
low = AverageFilter(R_{Ltemp})
low=AverageFilter(RLtemp)
y
L
′
=
R
L
t
e
m
p
−
l
o
w
y_L' = R_{Ltemp} -low
yL′=RLtemp−low
前三式,通过中频信号求取包络的过程;后三式,根据求取的包络计算出伪低频信号。
可以看到利用伪低频信号重构的结果和利用真实低频重构的结果十分接近,说明伪低频信号能够反应真实低频信号的主要特征。 - 基于获得的伪低频信号,使用稀疏编码方法获得低频有效信号字典:
- 基于低频有效信号的字典,重构出低频有效信号,去除残留面波:利用字典学习方法,从与真实低频有效信号形态相似的伪低频信号中进行学习编码,得到反应低频有效信号的字典。然后利用该字典,从真实低频数据中重构出有效信号,实现有效信号和面波的分离。
7. 褶积模型+传统方法:可控震源数据振铃压制
- 生成与实际数据空间结构相近的模拟可控震源数据及其对应标签,用于网络训练;
- 叠前地震数据超分辨率:通过拓频压制振铃,有利于进一步的初至拾取。
8. 基于机器学习的地震外源干扰压制
- 实际数据驱动的样本生成:突破深度网络缺乏训练样本的瓶颈
- 基于机器学习的自动外源定位:避免人工拾取的低效率
- 基于CNN的外源估计:有效提取强信号环境下的弱外源干扰
9. 基于地质模式匹配的成像速度更新
9.1 定性认识:不同数据的不变特征
- 迭代速度建模:大量人工交互+定性判断
- 最终速度模型的解释层位应该依然压在强反射同相轴上,即地质模式一致
- 井点成像速度应该和测井数据一致
- 偏移剖面和速度剖面都是对同一地质体的响应,二者应匹配
- 地质模式:速度与偏移结果联系的桥梁
9.2 背景与难点
全波形反演(FWI,Full-waveform inversion)理论上“完美”的地震波反演成像理论
- 依赖于采集手段,获取低频长偏距数据
- 受限于初始模型精度、计算成本高昂
9.3 解决方案
偏移剖面和速度剖面都是对同一地质体的响应,因此速度-反射面二者应匹配
t
(
走
时
,
已
知
)
=
z
(
反
射
面
位
置
,
未
知
)
v
(
速
度
模
型
,
未
知
)
t(走时,已知)=\frac{z(反射面位置,未知)}{v(速度模型,未知)}
t(走时,已知)=v(速度模型,未知)z(反射面位置,未知)
L
0
δ
v
=
d
→
m
=
L
0
T
=
L
0
T
L
0
δ
v
=
g
(
v
,
v
0
)
L_0\delta v = d \rightarrow m = L_0^\mathsf{T} =L_0^\mathsf{T}L_0\delta v = g(v,v_0)
L0δv=d→m=L0T=L0TL0δv=g(v,v0)
利用对抗生成网络,建立偏移结果
m
m
m,和背景慢度
v
0
v_0
v0、真实慢度
v
v
v之间的函数关系,时间速度-反射面匹配,得到优化速度模型作为FWI的初始速度模型,缓解周波跳跃问题
9.4 整体流程
- 所提出的深度网络辅助速度更新流程示意图
未完