缺失数据的常见特征与策略
特征:重要性高,缺失率低
策略:通过计算进行补充;通过经验或业务知识估计
特征:重要性高,缺失率高
策略:尝试其他渠道补全;使用其他字段通过数据获取(使用集成学习进行预测)
去除字段(不建议)
特征:重要性低,缺失率低
不做处理,或者简单进行填充(前向、后向或者均值填充)
特征:重要性低,缺失率高
去除该字段
缺失数据的常见特征与策略
特征:重要性高,缺失率低
策略:通过计算进行补充;通过经验或业务知识估计
特征:重要性高,缺失率高
策略:尝试其他渠道补全;使用其他字段通过数据获取(使用集成学习进行预测)
去除字段(不建议)
特征:重要性低,缺失率低
不做处理,或者简单进行填充(前向、后向或者均值填充)
特征:重要性低,缺失率高
去除该字段