- 博客(1)
- 收藏
- 关注
原创 数据预处理插补缺失值及比较不同方法的优劣
不难知道,这里缺失值的类型是完全随机缺失(MCAR),所以处理缺失值的方法可以是删除行、和对缺失值进行插补,MCAR可以用的插补方法有很多,这里主要练习比较最近邻插补,均值插补,单变量插补(这里用常数0进行插补),多重插补。注:add_indicator:boolean,(默认)False,True则会在数据后面加入n列由0和1构成的同样大小的数据,0表示所在位置非缺失值,1表示所在位置为缺失值。因为datasets的数据一般都没有空值,所以这里我们人为删除一些数据(随机)(2)最近邻插补(KNN插补)
2023-05-07 18:08:39
643
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人