一、题目 关键词: 工业机械设备故障预测、影响因素分析、分类任务(二分类/多分类)、标签类别不平衡、数据挖掘 二、数据预处理和分析 赛题所给数据包括机械设备使用环境和工作强度的相关指标,先进行数据查看/熟悉和预处理,分析可知数据没有重复值和缺失值。 接下来注意,训练集其实存在两个异常值,如下所示: 是否发生故障为 1,可具体故障类别却为 Normal,选择删除这两条数据,避免引入噪声。下面说一下变量和预测目标的含义: 变量: <