用预测来填补。
DMwR包 knnlmputation(),利用knn进行填补,数据集要求剔除因变量,即响应变量。
但是 knnlmputation(),对于因子变量的取值,其效果不是很好。这是可以考虑用回归树
repart函数里边的参数说明,当取值为数值型method用anova,当为因子型用class。
----------------------------------
填补缺失值还可以根据变量之间的相关性:当两两变量存在很强的相关性的时候可以利用回归的方法进行填补,当然,也可以根据强相关的变量的取值趋势进行填补
-------------------------------