数据缺失,汪汪缺失某一属性数据,列如Namen.sex.age.
Jack.male.24
Lucy.female.22
Tom.male.xxxx
1.忽略数据:在使用数据时忽略“Tom,male”这一行
2.人工填写缺失值:当数据集很大时,该方法比较耗时。
3.使用属性的中心度量(如,平均值,中位数)进行填充:如使用非缺失值的平均值,填充(22+24)/2=23,进行填充
4.使用与给定元组属与同一类的所有样本属性均值或者中位数,当样本够大时,够多,求均值或者中位数
5.使用回归,决策树等工具进行推理:该方法比较可靠,也是最流行的处理方法
数据缺失常见处理方法
最新推荐文章于 2024-01-22 23:06:30 发布