-
均值替换法:
适用于连续数据(定量数据),缺失数据占比不超过10%。
可直接生成新的数据列
-
中位数替换
适用于等级变量 例如满意度。(定性变量先要在变量试图中数值代替)
需要手动输入(根据频率结果选定替换值,然后升序拍排列-空值置顶, 最后输入替换值)
- 众数替换
适用于分类变量 例如性别。(定性变量先要在变量试图中数值代替)
其余同中位数操作。 - 回归估计法
同EM法。 - 期望最大化法(EM)
最优的缺失值处理法。(是先求期望,然后再求极大似然估计值)
在缺失数据较多的情形,收敛的速度较慢.