我将B题完整的思考了一遍之后,发现B题的前两问难度确实是比较低,但后两问在处理数据的时候就会遇到困难的,更加不用说做题了。
有一些细节需要大家注意一下:
矿石加工过程为2小时整(即:在调节温度2个小时后,可检测得到该调节温度所对应的矿石产品质量的评价指标(A,B,C,D)),即,在时间为:2022-01-13 00:50:00时,输入的 系统I温度 (Temperature of system I)和系统II温度 (Temperature of system II),产生的影响应该参考2022-01-13 02:50:00的评价指标。因此在解答问题之前,应该首先对数据进行筛选和处理。
注:
在附件1“产品质量(quality of the products)”中,共有240组数据,但是只有238个训练集,因为前两个在“温度(temperature)”中不能找到相对应的,因此需要舍弃。我们需要根据“产品质量(quality of the products)”中的数据来寻找“温度(temperature)”中所对应的。
在第三问上面,
温度,原矿参数是在两个小时之后才能反应出产品的质量,而过程数据是实时的。
问题三的数据处理也是比较困难的。
温度(temperature)是自01:00起,每分钟一次
产品质量(quality of the products)自00:50起,每小时检验一次
原矿参数(mineral parameter)自00:00起,每天测试一次
过程数据(process parameter)自2:30起,每3个小时测试一次
需要对这些数据在时间上规范化。
这主要使用了回归分析。大家尽力做就可以,做出来前两问获奖基本也没什么问题,真正拉开差距的为第3、4问。
有问题可以再私聊我。
祝大家建模顺利!!!