2024五一杯C题
本人美赛一等奖、Mathorcup数学竞赛一等奖、五一杯数学竞赛二等奖等
第一次写,不喜勿喷
煤炭是中国的主要能源和重要的工业原料。然而,随着开采深度的增加,地应力增大,井下煤岩动力灾害风险越来越大,严重影响着煤矿的安全高效开采。在各类深部煤岩动力灾害事故中,冲击地压已成为威胁中国煤矿安全生产最重要的灾害之一,冲击地压事故易造成严重的人员伤亡和财产损失。近年来,研究人员进行了大量深入的研究,采取了许多防控措施,中国煤矿安全形势持续稳步改善。但是,冲击地压事故仍时有发生,煤矿安全形势依然严峻,冲击地压的监测预警和有效防控仍是煤矿安全生产中亟待解决的科技问题。在深部煤矿开采过程中,可以监测声发射(AE)和电磁辐射(EMR)信号,电磁辐射和声发射传感器每30秒采集一个数据,可通过这些数据的变化趋势判断目前工作面或巷道是否存在冲击地压危险。电磁辐射和声发射数据随着采煤工作面的推进波动,一般在冲击地压发生前数天(如0-7天,即大约冲击地压发生前7天内)会有一些趋势性前兆特征,因此我们将电磁辐射和声发射数据分为5类,(A)正常工作数据;(B)前兆特征数据;©干扰信号数据;(D)传感器断线数据;(E)工作面休息数据,其中,A、B、C 类为工作面正常生产时的数据,D类为监测系统不正常时的数据,E类为停产期间的数据。附件1给出了2019年1月9日-2020年1月7日采集的电磁辐射和声发射数据,并且标记出了所对应的A、B、C类以及D或者E类(D/E)数据。请建立数学模型,完成以下问题:
问题1:如图1,已知现场工作面的部分电磁辐射和声发射信号中存在大量干扰信号,有可能是工作面的其他作业或设备干扰等因素引起,这对后期的电磁辐射和声发射信号处理造成了一定的影响。应用附件1和2中的数据,完成以下问题。
图1 以电磁辐射为例的干扰信号数据示意图
(1.1) 建立数学模型,对存在干扰的电磁辐射和声发射信号进行分析,分别给出电磁辐射和声发射中的干扰信号数据的特征(不少于3个)。
(1.2) 利用问题(1.1)中得到的特征,建立数学模型,对2022年5月1日-2022年5月30日的电磁辐射和2022年4月1日-2022年5月30日及2022年10月10日-2022年11月10日声发射信号中的干扰信号所在的时间区间进行识别,分别给出电磁辐射和声发射最早发生的5个干扰信号所在的区间,完成表1和表2。
对于1.1,
第一步;所有数据我们肯定要进行一轮数据预处理,这里的数据预处理包括;
例如数据清洗和标准化等。在我看来,这里不应该做异常值处理,因为他可能是干扰信号的特征。缺失值是建议用均值或者什么填充(一部分范围内均值等),因为他是时序数据,你删了间隔就不一样了
第二步;提取特征,也叫特征工程
对电磁辐射(EMR)和声发射(AE)信号进行时频分析,如计算FFT(快速傅里叶变换)或小波变换,以识别频域中的异常模式。
统计分析:计算每个信号的统计量,如平均值、标准差、峰值、偏度和峭度。-- 大家可以自行取某个时间段之类的
时间序列分析:分析信号的自相关性和季节性模式。
最后呢,对于时序特征,我就是做这方面的,并且是分类的,我推荐大家也可以用当前比较流行的技术(可能也不算流行,但会比手工特征好一些) — 神经网络,常见的神经网络提取特征可以用1D-CNN,RNN等。
第三步;使用机器学习技术进行特征选择:
应用如随机森林或梯度提升机的算法,来识别哪些特征最能区分干扰信号和非干扰信号。
亦或者是聚类啊什么的,反正你最终要选出三个来嘛,可以通过一些机器学习技术验证一下。
接下来的思路2r一份哦~
https://mbd.pub/o/bread/ZpWXk51w
只有思路!只有思路! 目前还没时间写代码,如果需要的人多我会去写代码的