摘要:在这项工作中,我们报告了局部敏感哈希(LSH)在大规模地震数据中的一种新应用。基于重复发生的地震之间的高波形相似性,我们的应用程序通过LSH搜索相似的时间序列片段来识别潜在的地震。然而,这种基于lsh的应用程序的简单实现难以扩展超过在单个地震台站测量的3个月连续时间序列数据。作为一个数据驱动的科学工作流的案例研究,我们演示了如何将领域知识整合到工作负载中,以提高效率和结果质量。我们描述了从预处理到后处理的分析管道的几个端到端优化,这使得应用程序可以扩展到多个地震台站测量的时间序列数据。我们的优化在端到端分析管道中实现了超过100个加速。这种改进的可扩展性使地震学家能够对十多个地震台站十多年来的连续时间序列数据进行地震分析,并直接使加州代阿布洛峡谷核电站附近发现了597次新地震,新西兰发现了6123次新地震。
PIPELINE OVERVIEW
图2说明了端到端检测管道的三个主要组成部分:指纹提取、相似度搜索和时空对齐
FINGERPRINT EXTRACTION
LSH-BASED SIMILARITY SEARCH
SPATIOTEMPORAL ALIGNMENT
通过整合领域知识,我们能够显著减少输出的大小,并在相似性搜索结果中优先考虑地震发现。
实验