赛后总结：第四届工业大数据竞赛注塑成型

YueTann

已于 2023-07-27 14:06:16 修改

阅读量1k

点赞数

分类专栏：数据竞赛文章标签：数据挖掘机器学习深度学习

于 2020-11-29 09:28:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38812492/article/details/110305058

版权

数据竞赛专栏收录该内容

25 篇文章

订阅专栏

关注我的公众号YueTan进行交流探讨
欢迎关注数据比赛方案仓库 https://github.com/hongyingyue/Competition-solutions

赛后总结：第四届工业大数据竞赛注塑成型

在这里插入图片描述
原文首发于第四届工业大数据竞赛注塑成型

前言

以第四届工业大数据竞赛虚拟量测任务为例，介绍大家的思路。自己代码乱写，导致不知道最后要复现的是哪个，加上工作上各种人员优化，就没有进一步。虽然放弃比赛，但对数据掌握的还算透彻，刚好决赛也都有答辩视频，就我个人理解和优秀选手的开源，在这里和大家一起分享一下。比赛链接：http://www.industrial-bigdata.com/Competition

只有一次评分的机会，本以为是摸奖赛，但前排还是很稳健。祝贺各位优秀的选手，也通过直播学习了一下大家的思路，学习了很多新思路和方法，总结如下。很多基于我对赛题的理解，以及根据答辩视频的猜测，如有错误之处，欢迎指正。

工业大数据

工业大数据有着自己的特点，因此结合工业特点和机器学习是关键的一点。

工业大数据数据质量的“3B”挑战：broken，bad，background

工业大数据的“3C”目的：Comparison（比较性），Correlation （相关性），Consequence （因果性）

关于数据和模型也可以参考我之前的两篇文章：

数据竞赛：第四届工业大数据竞赛-虚拟测量

数据挖掘III：数据敏感性

模型总结

star：关键点在于，深度学习模型一把梭，效果也非常好，能把深度学习模型调的效果如此之好很厉害。主要采用ResSluice模型，以及多个size同时学习的多任务学习。

中南小组：深挖机器参数和过程参数。也是深度学习模型，采用了卷积神经网络conv1D和spatial pyramid pooling，对时域特征裁补padding，并将时域特征进行整合。

Micro_i：主要在于运用了时间序列特征方法以及autoencoder的表征学习。打标，根据调机段对尺寸数据分组，也就是时间序列相关的衍生特征。在特征生成和特征筛选方面做的很细致。

GT_respect：详细细致的特征清洗、缺失填充、标准化、PCA降维。模型采用xgboost对size1和size2建模，size3采用LightGBM建模，并尝试了模型融合。

MX：树模型与阶段优化。时域统计特征，并注重了注射、保压、冷却、脱模阶段的时域特征，额外的比如peak-to-peak等特征，采用了Lightgbm模型。主要采用相关性降维。

DGAIBD：发现了训练集和测试集的不同。异常样本分析去掉了几个size异常点，而特征几乎差不多，因此去掉了这几个异常点。特征采用6个时间特征与3个频域特征。并且将size3的预测值作为size1的特征用来预测了。

石龙：去除唯一值特征、共线性特征和异常点，高频数据采用平均值、中位数、最大值、求和、标准差、偏度等。模型采用深度学习，bn层和dropout层，设计时借鉴无限宽的神经网络特点。loss函数优化、参数初始化。

许泽霖：特征工程上对高频传感器提取了mean\max\min\median\var等特征，还依据不同phase选取了很多的特征，skew，kurt，sum等。模型xgboost和lightgbm，样本选择时去除了几个异常点，也用了主成分分析。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

YueTann 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。