1、地震数据格式
1.1 SAC
SAC波形数据是以数据处理为目的的格式,这种格式一般只包含单个台站单个分量或多分量的数据,在SAC用户指南中描述了SAC波形数据输入格式。利用读入的数据,可以进一步做其他处理,如绘制波形图。
1.2 SEED
SEED波形数据是以归档和交换为目的的格式,这种格式要求一个文件中包含足够多的数据信息,SEED格式的地震波形数据文件包括两个部分:第一部分是文件的头段,以ASCII码写成,其中包含了生成该段波形数据的台网信息、地震信息和波形数据本身的信息,为波形数据的元数据;第二部分是波形数据本身,以二进制编码写成,通常是按一定算法生成的压缩数据,可参阅SEED 参考手册掌握至少一种SEED格式数据的读出工具软件,从而能用它读出关于该段波形数据的元数据信息和把SEED格式波形数据转换成可由自己的程序读入的格式,例如SAC二进制或ASCII格式。
1.3 miniSEED
miniSEED 格式是 SEED 格式的一个子集,其只包含时间序列和极少量的其他信息,libmseed 是一个比较友好的函数库,可以用于读写 miniSEED 文件。
2、地震学AI模型
地震学AI模型包括震相拾取模型、初动检测和震源参数计算、地震信号滤波程序、地震检测工具链、频散拾取等模型;
3、基于PIE Engine AI的地震学模型
以地震事件为基础,导出地震事件的波形数据,对应地震事件波形数据支持上传到样本库,进行地震学AI模型的训练与推断,包括震相拾取模型、地震信号滤波程序、频散拾取等模型;(地球所并未提供完整的地震事件数据,均为谛听数据下载或者拷贝群里的一些测试数据)
3.1 集成地震学模型难点
- 算法获取样本适配 数据集有两种类型,原始地震数据和地球所h5样本数据,训练脚本需同时适配地震数据及h5样本数据,网络结构需添加字段判断是h5还是其余地震数据;
- 推理样本数据参数 解译地震数据输入为文件夹或者单个数据;
- 样本库构建 需支持地震数据及h5数据,h5数据可达上百G。