Bryan直播:sklearn入门:数据预处理、模型评估、模型融合——学习笔记
1.预处理当我们拿到一批原始数据以后,需要考虑以下问题:1)首先要明确有多少特征,哪些是连续的,哪些是类别特征。2)检查有没有缺失值,选择合适的缺失值填补方法,使数据保持完整。3)对连续的数值型变量进行标准化,使得均值为0,方差为1。4)对类别型的特征进行one-hot编码。5)将需要转换成类别型数据的连续型数据进行二值化。6)为防止过拟合或者其他原因,选择是否要将数据进行正则化。介绍一些pand...
原创
2018-04-28 14:08:57 ·
925 阅读 ·
0 评论