- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 天池津南数字制造算法【赛场一】第32名比赛总结
一、数据预处理 由于所给数据“脏”数据比较多,所以首先需要做大量的预处理,包括: 1.处理类型错误的数据。如‘A25’列中数据应该为数值型却混入了一个‘1900/3/10 0:00’时间数据。 2.处理时间数据的异常。 3.处理明显的数值异常。 4.使用中位数填充缺失值 二、特征工程 特征工程是决定一个比赛的关键,因此在特征上我们做了大量处理,包括: 1...
2019-03-25 21:17:31 1071 5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人