问题 1:针对附件 1~8 中的地震波数据,找出一系列合适的指标与判据,构建震源属性识别模型,进行天然地震事件(附件 1~7)与非天然地震事件(附件 8)的准确区分;
思路:首先需要进行数据预处理,将各组波形数据进行整理,并对应打上天然地震事件0和非天然地震事件1的标签。接着对应每组波形数据,进行特征构建与提取,如峰度、偏度、振幅、均值、标准差、最小最大值,然后可以进行适当的特征筛选(如卡方检验或者相关系数判别法),由此建立出二分类机器学习模型(可以使用支持向量机、逻辑回归、随机森林等等分类模型,也可以使用异常检测算法如LOF/LOCI/ABOD算法,可以更好地处理正异常样本不均衡的情况)。
#数据处理
import pandas as pd
import numpy as np
df_feature=pd.DataFrame([],columns=['事件','观测站','均值','振幅','标准差','最小值','最大值','峰度','偏度','是否天然'])
def get_features(path,event,station):#针对天然事件1~7
fr = open(path, 'r')
all_lines = fr.readlines()
dataset = []
for line in all_lines:
line = line.strip().split(' ')
dataset