你和“懂AI”之间,只差了一篇论文
很多读者给芯君后台留言,说看多了相对简单的AI科普和AI方法论,想看点有深度、有厚度、有眼界……以及重口味的专业论文。
为此,在多位AI领域的专家学者的帮助下,我们解读翻译了一组顶会论文。每一篇论文翻译校对完成,芯君和编辑部的老师们都会一起笑到崩溃,当然有的论文我们看得抱头痛哭。
同学们现在看不看得懂没关系,但芯君敢保证,你终有一天会因此爱上一个AI的新世界。
读芯术读者论文交流群,请加小编微信号:zhizhizhuji。等你。
这是读芯术解读的第1篇论文
ICDM2019
基于多尺度描述神经网络的余震检测方法
Aftershock Detection with Multi-Scale Description based Neural Network
中国科学技术大学,百度
本文是中国科学技术大学和百度TIC联合发表于ICDM 2019的工作,文章提出了一种利用多尺度描述的卷积神经网络进行余震检测的方法,可以充分利用已有数据学习出余震波形的多尺度特征和不同台站之间的关系,用来检测当前波形是否是余震。为此我们将从传统检测方法出发,启发我们设计新的适应数据特点的神经网络结构。
引言
地震检测是地震预警和地震研究的基础问题,它的任务是分辨地震波和噪声。而当一个地震发生后,常常伴随着一系列的余震。这些余震震级小噪声多,难以检测,但对于地震活动的研究十分重要。同时余震会严重影响灾后救援工作并造成更加严重的伤亡,因此余震的检测是进行地震研究,减小地震损失的重要任务。
在过去的40多年里,地震检测发展出了众多的方法,如基于能量的方法,模板匹配的方法和人工神经网络的方法。其中最为基础和广泛使用的方法是STA/LTA(短时平均值/长时平均值),这也是基于能量的方法中的典型方法,也体现了地震数据的特征。这种方法是基于时间序列长时短时的比较,可以很快速的识别序列中小尺度相对于大尺度的变化。这种方法总是很有效而且效率很高,但是其很容易受到噪声影响,难以平衡recall(召回率)和precision(精确率)。而人工神经网络的方法可以很好的抵抗噪声,具有优秀的泛化性能和灵活性。但是在之前的工作中大部分网络结构的设计并未很好的考虑到地震数据的特点,因此在余震数据集上缺乏分辨力。下图展示了地震数据的特点,图(a)显示地震数据一般是3变量的时间序列,分别代表了不同的振动方向,在地震发生时会有波形的剧烈变化。图(b)显示了STA,LTA和STA/LTA的变化曲线,可以看出不同尺度反映了不同的变化特征,STA/LTA的数值对突发变化更加敏感,这也是地震检测中需要重点关注的变化。

因此在本文中,我们着重考虑了这种地震数据的特征,从而提出了一种适合地震数据的多尺度描述的卷积神经网络方法进行余震检测。这种方法可以逐步抽取不同尺度的特征描述,并将不同尺度的描述进行比较得到多尺度混合特征。之后考虑到一个地震发生,会被多个台站所检测到,这些波形之间具有相似的特征。在实时检测时,多台站的检测信息需要考虑台站之间的通讯限制,因此我们尝试在训练时就加入这部分多台站信息,以得到更好的训练效果。我们使用多任务学习的框架进行训练来实现这种效果,同时进行余震检测和同源地震检测两个任务,同源地震检测任务就会利用多台站的信息对网络参数进行优化提升。多尺度描述和多任务学习两部分共同构成了我们的余震检测模型,下面一节我们来具体介绍一下我们模型的具体结构。
模型
这一节我们将从3个方面介绍模型,首先是MSD-cell,这是我们模型抽取和混合多尺度描述的核心结构,之后是对MSDNN的整体介绍,最后是对多任务学习的任务设计进行介绍。
MSD-cell(多尺度描述模块)
模块结构如下图所示:

具体来说,第i个多尺度描述单元具有两个输入:记忆状态Si和特征状态Fi,Si用来储存多尺度描述的混合特征,Fi用来代表当前尺度的特征,下标i表示多尺度描述单元的序号。当输入Fi后,先经过一个卷积层(例如,1x3x32/1,其中1x3是指卷积核大小,32是指通道数,1是步长),得到更高尺度的特征,记为Fic;之后,Fic会经过一个最大池化层(例如,1x2/2,其中1x2是池化大小,2是步长)输出Fi+1,作为下一个多尺度描述单元的一个输入。同时,Fic会与Si直接拼接起来为不同尺度描述的比较和混合做准备;Si与Fic的通道数相同均为N(例如32),拼接过后,记为Ji,通道数转化为2N,之后再经过一个卷积层(例如,1x1x32/1)。这个卷积层的作用是使用多种方案对Ji的各个通道乘以一个系数进行加和,而Ji中一半通道是包含了所有低尺度信息的多尺度比较混合特征Si,另一半是当前尺度特征Fic,这样就实现了多层级特征Si和当前层级特征Fic的比较和混合,并使通道数降回N。最后经过一个最大池化层(1x2/2)输出多尺度混合特征Si+1,作为下一个多尺度描述单元的另一个输入。
通过上述方式即完成了一个多尺度描述单元的输入输出。公式化表示如下:

其中W代表卷积网络的参数。这种结构的MSD-cell可以在不断扩大感知范围的同时考虑不同尺度特征之间的关系,记录下不同尺度特征中的有用信息。这种结构也易于扩展,可以通过堆叠增加深度或者适应不同大小的数据尺寸。
MSDNN(多尺度描述网络)
网络结构如下图所示:

网络的输入是一个地震波序列的窗口,其中包含三个时间序列,分别代表三个方向的震动波形,可以被视为输入的3个通道。地震数据在输入网络之前会首先进行滤波和标准化放缩,以便于更好的训练网络。
在数据输入后首先会经过一个卷积层进行初始特征的提取,同时将通道维度扩大准备输入MSD-cell。之后输入一系列堆叠的MSD-cell获取多尺度混合特征(Feature),获得了多尺度混合表征后再输入两层全连接层和一层softmax层得到是否是余震的分类结果。这里整个网络分为share part和detection part是为了多任务学习做准备,在多任务学习中不同任务将会共享share part层的参数。
多任务学习
在多任务学习中除了余震检测的主任务,我们利用不同台站会检测到同一个地震的关联设计了一个同源地震检测的辅助任务。这个同源地震检测的输入是一个地震波对,任务结果是判断这个地震波对是否是同源地震。其输入数据的构成如下图所示:

不同台站之间记录的地震波相互组成地震波对,同源地震为正例,非同源地震为负例。利用这种数据我们可以设计如下图所示的多任务学习网络:

多任务学习框架包含余震检测模块与同源地震检测模块,前文介绍的多尺度描述网络作为余震检测任务模块与同源地震检测任务模块共享MSD-cell堆叠的部分(shared part)。所述同源地震检测任务模块(auxiliary part)包含一个相减操作层和两层全连接层;相减操作层的输入为波形数据对对应的两个多尺度混合特征(feature),且每一个都与余震检测任务模块(detection part)的输入相同。通过相减操作层将相减后的结果送入两个全连接层,之后再经过一个softmax层得到同源地震检测的分类结果,即波形对为同源地震(homology)或者非同源地震(non-homology)。
在网络中,同源地震因为具有相同的地震源具有相似的特征,因此其多尺度混合特征也应当更加相似。通过多任务学习中的同源地震检测任务,我们就可以利用相减层优化多尺度混合特征,使得具有相似特征的地震波的多尺度混合特征更加相似,扩大地震波与非地震波的多尺度混合特征之间的差距,从而提升实验效果,强化网络的特征提取能力。
实验
数据
我们使用2008年7月分四川各地震监测台站的数据进行实验,这也是8.0级汶川大地震的后续余震监测数据。这个数据由2833个余震组成,每个余震会被不同的台站检测到,共计检测到9891个记录到的余震波序列,这些序列就是我们训练和验证时的正例。为了提高模型的辨别能力,也为了验证模型的效果,对于负例,我们使用STA/LTA的方法进行获取。我们先利用STA/LTA方法检测出一系列的时间点,将这些时间点与之前的9891个余震序列比较,没有对应的就是负例。这种负例与正例相似度高,可以更好的训练模型的鉴别能力,也可以更好地验证我们模型的性能。通过这种方法我们总共获取了109719个负例,为了解决正负例的不平衡问题,我们通过对余震波序列随机添加20-80dB的噪声来扩展正例。
对于同源地震检测任务,我们通过地震波在不同台站间的传播时间确定同源地震对和非同源地震对,最终我们获得了642112对正例和288962对负例。我们依据时间顺序使用前5/6作为训练集,后1/6作为测试集。
实验设置
实验使用交叉熵作为优化目标,衰减率为0.8的Momentum优化器进行优化。余震检测任务的初始学习率设置为0.02,同源地震检测任务的初始学习率设置为0.02*0.1,这样可以消减辅助任务的约束程度,更合适的优化主任务(余震检测任务)的特征表示。
实验结果
主要实验结果如下表所示:

我们的MSDNN方法优于包括先进的神经网络地震检测算法ConvNetQuake,先进的卷积神经网络方法Inception Net在内的一系列基线方法,在真实数据集上验证了MSDNN可以更好地分辨余震波序列和噪声。
为了进一步理解网络的性能效果,下图中我们展示了一系列结果:

(a)是所有错误识别成余震的波形平均的结果,与样例(b)(c)比较可以看出这些波形虽然不是地震但是有些十分相似。因此我们与地震专家复查检测结果,经专家确定,这些False Positive结果中确实有一部分都是余震波形,然而没有被台站记录下来是因为人工标注会有漏标,余震级别低的也不会标注。因此我们的方法在实际中可以达到更好的结果,也可以帮助弥补缺失的余震波形记录。
(b)是未识别出的余震波形平均的结果,结合样例(e)(f)可以看出这种容易被漏掉的波形P波S波距离较近,波形较为模糊。
为了进一步体现多任务学习的效果,下图展示了有无多任务时多尺度混合特征的分布。

可以看出,加入同源地震检测的多任务学习后,余震波形的多尺度混合特征更加相近,有效改善网络特征提取的效果。
结论
文章提出了一种利用多尺度描述的卷积神经网络(MSDNN)结合多任务学习进行余震检测的方法,可以充分利用已有数据学习出余震波形的多尺度特征和不同台站之间的关系,用来检测当前波形是否是余震。实验验证我们的方法可以很好的识别余震波形的特征,分辨余震波形和噪声波形,为地震检测任务提供了新的方法和视野。

留言 点赞 发个朋友圈
我们一起分享AI学习与发展的干货