ICDM2019|基于多尺度描述神经网络的余震检测方法

640?wx_fmt=jpeg

你和“懂AI”之间,只差了一篇论文

很多读者给芯君后台留言,说看多了相对简单的AI科普和AI方法论,想看点有深度、有厚度、有眼界……以及重口味的专业论文。

为此,在多位AI领域的专家学者的帮助下,我们解读翻译了一组顶会论文。每一篇论文翻译校对完成,芯君和编辑部的老师们都会一起笑到崩溃,当然有的论文我们看得抱头痛哭。

同学们现在看不看得懂没关系,但芯君敢保证,你终有一天会因此爱上一个AI的新世界。

读芯术读者论文交流群,请加小编微信号:zhizhizhuji。等你。

这是读芯术解读的第1篇论文


ICDM2019

基于多尺度描述神经网络的余震检测方法

Aftershock Detection with Multi-Scale Description based Neural Network

中国科学技术大学,百度

本文是中国科学技术大学和百度TIC联合发表于ICDM 2019的工作,文章提出了一种利用多尺度描述的卷积神经网络进行余震检测的方法,可以充分利用已有数据学习出余震波形的多尺度特征和不同台站之间的关系,用来检测当前波形是否是余震。为此我们将从传统检测方法出发,启发我们设计新的适应数据特点的神经网络结构。

640?wx_fmt=png

原文:
Qi Zhang, Tong Xu, Hengshu Zhu, Lifu Zhang,Hui Xiong, Enhong Chen, and Qi Liu, Aftershock Detection with Multi-ScaleDescription based Neural Network,  In Proceedings of the 19th IEEEInternational Conference on Data Mining (ICDM-2019) , Beijing, China,2019.

640?wx_fmt=jpeg

引言

 

地震检测是地震预警和地震研究的基础问题,它的任务是分辨地震波和噪声。而当一个地震发生后,常常伴随着一系列的余震。这些余震震级小噪声多,难以检测,但对于地震活动的研究十分重要。同时余震会严重影响灾后救援工作并造成更加严重的伤亡,因此余震的检测是进行地震研究,减小地震损失的重要任务。

在过去的40多年里,地震检测发展出了众多的方法,如基于能量的方法,模板匹配的方法和人工神经网络的方法。其中最为基础和广泛使用的方法是STA/LTA(短时平均值/长时平均值),这也是基于能量的方法中的典型方法,也体现了地震数据的特征。这种方法是基于时间序列长时短时的比较,可以很快速的识别序列中小尺度相对于大尺度的变化。这种方法总是很有效而且效率很高,但是其很容易受到噪声影响,难以平衡recall(召回率)和precision(精确率)。而人工神经网络的方法可以很好的抵抗噪声,具有优秀的泛化性能和灵活性。但是在之前的工作中大部分网络结构的设计并未很好的考虑到地震数据的特点,因此在余震数据集上缺乏分辨力。下图展示了地震数据的特点,图(a)显示地震数据一般是3变量的时间序列,分别代表了不同的振动方向,在地震发生时会有波形的剧烈变化。图(b)显示了STA,LTA和STA/LTA的变化曲线,可以看出不同尺度反映了不同的变化特征,STA/LTA的数值对突发变化更加敏感,这也是地震检测中需要重点关注的变化。

640?wx_fmt=png

因此在本文中,我们着重考虑了这种地震数据的特征,从而提出了一种适合地震数据的多尺度描述的卷积神经网络方法进行余震检测。这种方法可以逐步抽取不同尺度的特征描述,并将不同尺度的描述进行比较得到多尺度混合特征。之后考虑到一个地震发生,会被多个台站所检测到,这些波形之间具有相似的特征。在实时检测时,多台站的检测信息需要考虑台站之间的通讯限制,因此我们尝试在训练时就加入这部分多台站信息,以得到更好的训练效果。我们使用多任务学习的框架进行训练来实现这种效果,同时进行余震检测和同源地震检测两个任务,同源地震检测任务就会利用多台站的信息对网络参数进行优化提升。多尺度描述和多任务学习两部分共同构成了我们的余震检测模型,下面一节我们来具体介绍一下我们模型的具体结构。

640?wx_fmt=jpeg

模型

这一节我们将从3个方面介绍模型,首先是MSD-cell,这是我们模型抽取和混合多尺度描述的核心结构,之后是对MSDNN的整体介绍,最后是对多任务学习的任务设计进行介绍。

 

MSD-cell(多尺度描述模块)

模块结构如下图所示:

640?wx_fmt=png

具体来说,第i个多尺度描述单元具有两个输入:记忆状态Si和特征状态Fi,Si用来储存多尺度描述的混合特征,Fi用来代表当前尺度的特征,下标i表示多尺度描述单元的序号。当输入Fi后,先经过一个卷积层(例如,1x3x32/1,其中1x3是指卷积核大小,32是指通道数,1是步长),得到更高尺度的特征,记为Fic;之后,Fic会经过一个最大池化层(例如,1x2/2,其中1x2是池化大小,2是步长)输出Fi+1,作为下一个多尺度描述单元的一个输入。同时,Fic会与Si直接拼接起来为不同尺度描述的比较和混合做准备;Si与Fic的通道数相同均为N(例如32),拼接过后,记为Ji,通道数转化为2N,之后再经过一个卷积层(例如,1x1x32/1)。这个卷积层的作用是使用多种方案对Ji的各个通道乘以一个系数进行加和,而Ji中一半通道是包含了所有低尺度信息的多尺度比较混合特征Si,另一半是当前尺度特征Fic,这样就实现了多层级特征Si和当前层级特征Fic的比较和混合,并使通道数降回N。最后经过一个最大池化层(1x2/2)输出多尺度混合特征Si+1,作为下一个多尺度描述单元的另一个输入。

通过上述方式即完成了一个多尺度描述单元的输入输出。公式化表示如下:

640?wx_fmt=png

其中W代表卷积网络的参数。这种结构的MSD-cell可以在不断扩大感知范围的同时考虑不同尺度特征之间的关系,记录下不同尺度特征中的有用信息。这种结构也易于扩展,可以通过堆叠增加深度或者适应不同大小的数据尺寸。

 

MSDNN(多尺度描述网络)

网络结构如下图所示:

640?wx_fmt=png

网络的输入是一个地震波序列的窗口,其中包含三个时间序列,分别代表三个方向的震动波形,可以被视为输入的3个通道。地震数据在输入网络之前会首先进行滤波和标准化放缩,以便于更好的训练网络。

在数据输入后首先会经过一个卷积层进行初始特征的提取,同时将通道维度扩大准备输入MSD-cell。之后输入一系列堆叠的MSD-cell获取多尺度混合特征(Feature),获得了多尺度混合表征后再输入两层全连接层和一层softmax层得到是否是余震的分类结果。这里整个网络分为share part和detection part是为了多任务学习做准备,在多任务学习中不同任务将会共享share part层的参数。

多任务学习

在多任务学习中除了余震检测的主任务,我们利用不同台站会检测到同一个地震的关联设计了一个同源地震检测的辅助任务。这个同源地震检测的输入是一个地震波对,任务结果是判断这个地震波对是否是同源地震。其输入数据的构成如下图所示:

640?wx_fmt=png

不同台站之间记录的地震波相互组成地震波对,同源地震为正例,非同源地震为负例。利用这种数据我们可以设计如下图所示的多任务学习网络:

640?wx_fmt=png

多任务学习框架包含余震检测模块与同源地震检测模块,前文介绍的多尺度描述网络作为余震检测任务模块与同源地震检测任务模块共享MSD-cell堆叠的部分(shared part)。所述同源地震检测任务模块(auxiliary part)包含一个相减操作层和两层全连接层;相减操作层的输入为波形数据对对应的两个多尺度混合特征(feature),且每一个都与余震检测任务模块(detection part)的输入相同。通过相减操作层将相减后的结果送入两个全连接层,之后再经过一个softmax层得到同源地震检测的分类结果,即波形对为同源地震(homology)或者非同源地震(non-homology)。

在网络中,同源地震因为具有相同的地震源具有相似的特征,因此其多尺度混合特征也应当更加相似。通过多任务学习中的同源地震检测任务,我们就可以利用相减层优化多尺度混合特征,使得具有相似特征的地震波的多尺度混合特征更加相似,扩大地震波与非地震波的多尺度混合特征之间的差距,从而提升实验效果,强化网络的特征提取能力。

640?wx_fmt=jpeg

实验

数据

我们使用2008年7月分四川各地震监测台站的数据进行实验,这也是8.0级汶川大地震的后续余震监测数据。这个数据由2833个余震组成,每个余震会被不同的台站检测到,共计检测到9891个记录到的余震波序列,这些序列就是我们训练和验证时的正例。为了提高模型的辨别能力,也为了验证模型的效果,对于负例,我们使用STA/LTA的方法进行获取。我们先利用STA/LTA方法检测出一系列的时间点,将这些时间点与之前的9891个余震序列比较,没有对应的就是负例。这种负例与正例相似度高,可以更好的训练模型的鉴别能力,也可以更好地验证我们模型的性能。通过这种方法我们总共获取了109719个负例,为了解决正负例的不平衡问题,我们通过对余震波序列随机添加20-80dB的噪声来扩展正例。

对于同源地震检测任务,我们通过地震波在不同台站间的传播时间确定同源地震对和非同源地震对,最终我们获得了642112对正例和288962对负例。我们依据时间顺序使用前5/6作为训练集,后1/6作为测试集。

 

实验设置

实验使用交叉熵作为优化目标,衰减率为0.8的Momentum优化器进行优化。余震检测任务的初始学习率设置为0.02,同源地震检测任务的初始学习率设置为0.02*0.1,这样可以消减辅助任务的约束程度,更合适的优化主任务(余震检测任务)的特征表示。

 

实验结果

主要实验结果如下表所示:

640?wx_fmt=png

我们的MSDNN方法优于包括先进的神经网络地震检测算法ConvNetQuake,先进的卷积神经网络方法Inception Net在内的一系列基线方法,在真实数据集上验证了MSDNN可以更好地分辨余震波序列和噪声。

为了进一步理解网络的性能效果,下图中我们展示了一系列结果:

640?wx_fmt=png

(a)是所有错误识别成余震的波形平均的结果,与样例(b)(c)比较可以看出这些波形虽然不是地震但是有些十分相似。因此我们与地震专家复查检测结果,经专家确定,这些False Positive结果中确实有一部分都是余震波形,然而没有被台站记录下来是因为人工标注会有漏标,余震级别低的也不会标注。因此我们的方法在实际中可以达到更好的结果,也可以帮助弥补缺失的余震波形记录。

(b)是未识别出的余震波形平均的结果,结合样例(e)(f)可以看出这种容易被漏掉的波形P波S波距离较近,波形较为模糊。

为了进一步体现多任务学习的效果,下图展示了有无多任务时多尺度混合特征的分布。

640?wx_fmt=png

可以看出,加入同源地震检测的多任务学习后,余震波形的多尺度混合特征更加相近,有效改善网络特征提取的效果。

640?wx_fmt=jpeg

结论

文章提出了一种利用多尺度描述的卷积神经网络(MSDNN)结合多任务学习进行余震检测的方法,可以充分利用已有数据学习出余震波形的多尺度特征和不同台站之间的关系,用来检测当前波形是否是余震。实验验证我们的方法可以很好的识别余震波形的特征,分辨余震波形和噪声波形,为地震检测任务提供了新的方法和视野。

640?wx_fmt=png
推荐阅读专题


640?wx_fmt=jpeg

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

推荐文章阅读

阅读终点,创作起航,您可以撰写心得或摘录文章要点写篇博文。去创作
  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 知识图谱(Knowledge Graph)是一种用于表示和存储大规模结构化和半结构化数据的图形数据库。它将实体、关系和属性组织在一张图中,并通过丰富的语义关系连接起来。知识图谱的构建和使用已经在各个领域中得到了广泛的应用。 2019年的ICDM(International Conference on Data Mining)上,关于知识图谱的研究和应用有许多重要的进展和综述。这些综述主要涉及以下几个方面: 1. 知识图谱构建方法:综述中介绍了多种知识图谱构建方法,包括基于文本挖掘的方法、基于结构化数据的方法和基于众包的方法等。这些方法能够从不同的数据源中提取实体、关系和属性,并将其组织成一个完整的知识图谱。 2. 知识图谱表示学习:综述中介绍了知识图谱表示学习的方法,包括传统的基于矩阵分解的方法和最新的基于深度学习的方法。这些方法能够将知识图谱中的实体和关系映射到低维向量空间中,以便进行后续的数据分析和推理。 3. 知识图谱应用:综述还介绍了知识图谱在不同领域中的应用,例如自然语言处理、推荐系统和智能问答等。这些应用能够从知识图谱中获取更丰富的信息,并对用户的需求进行更准确的响应。 总的来说,知识图谱综述2019 ICDM反映了知识图谱领域的最新研究和发展趋势。通过了解和应用这些研究成果,我们可以更好地利用知识图谱来解决实际问题,推动人工智能和大数据的发展。 ### 回答2: 知识图谱是一个用于表示和组织大规模信息的结构化知识库,它以图的形式将实体、关系和属性表示为节点和边。它的目标是提供一个计算机可理解的知识表达形式,以帮助机器理解和推理人类知识。近年来,知识图谱在信息检索、问答系统、社交网络分析等领域取得了显著的进展。 2019年icdm(IEEE International Conference on Data Mining)上,对知识图谱的研究进行了广泛综述。研究者们关注了知识图谱的构建、表示学习、推理和应用等方面。 首先,研究者们讨论了知识图谱的构建方法。这包括自动从结构化和非结构化数据中抽取实体、关系和属性,以及采用人工注释和知识编辑的方式进行构建。还有一些研究致力于解决构建中的挑战,如噪声数据处理、实体消歧和关系抽取等。 其次,关于知识图谱表示学习的研究也被广泛涵盖。这些方法旨在将知识图谱中的实体和关系映射到低维向量空间,从而捕捉它们之间的语义关系。一些流行的方法包括基于图卷积网络(Graph Convolutional Networks, GCN)和深度生成模型(Deep Generative Models)的表示学习方法。 此外,知识图谱的推理方法也是icdm研讨的重点。推理可以通过图匹配、规则推理和基于规则的推理等方式来实现。这些方法可以帮助发现实体之间的隐藏关联和新的知识。 最后,icdm还关注了知识图谱在各种应用领域的应用。这包括推荐系统、信息检索、问答系统、社交网络分析等。研究者们探索了如何使用知识图谱的结构化表示来提高这些领域中的性能。 综上所述,2019 icdm对知识图谱的研究进行了广泛综述,涵盖了从构建到推理的各个方面,并展示了知识图谱在不同应用领域的潜力和前景。 ### 回答3: 知识图谱是一种能够存储和表示知识的图形化数据结构,它通过将知识组织成实体、属性和关系的形式来描述现实世界中的事物和概念。而2019年的ICDM(International Conference on Data Mining)会议就是在这一领域进行的重要学术会议之一。 2019年ICDM知识图谱方向的研究主题包括但不限于知识图谱的构建、表示和推理。首先,研究人员关注如何有效地构建大规模的知识图谱。这涉及到对知识源的挖掘和知识抽取技术的应用,以从不同的元数据中自动提取和整合实体、属性和关系。 其次,关于知识图谱的表示方法是研究的重点。学者们致力于寻找有效的表示方法,以将知识图谱映射到低维空间中,从而能够更好地支持各类图谱相关的任务,如检索、推荐和分类等。此外,还有一些学者关注于如何利用深度学习和图神经网络等高级模型来提升知识图谱的表示能力。 最后,推理技术在知识图谱中也起到重要作用。知识图谱推理能够通过检测图谱中的潜在推理规则和模式,从中获得新的知识。这项研究的目标是能够自动发现和推理出更多的隐藏知识,从而拓展和完善知识图谱的内容。 综上所述,2019年ICDM会议以知识图谱为主题,聚焦于知识图谱的构建、表示和推理等方面的研究。这些研究对于促进知识图谱的发展和应用具有重要意义,将为相关领域的学术研究和实践应用提供新的思路和方法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「已注销」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值