产生原因 机械原因:例如数据存储失败,存储器损坏导致数据收集或保存失败 人为原因:由于人的主观失误,历史局限或有意隐瞒造成数据缺失 处理方法 忽略 1,忽略有缺失值的样本 填补 2,使用特殊值来弥补缺失值 3,使用可用特征的均值来填补缺失值 4,使用相似样本的均值来填补缺失值 5,利用机器学习等预测 删除 6,删除含有缺失值的个案