数据缺失 处理方法 连续的特征分类的特征利用算法预测缺失值 连续的特征 缺失比例比较严重 可以考虑舍弃可以考虑使用平均值 中位数 分位数填充算法预测 (利用样本中的其它特征作为 特征值,有缺失的特征作为目标值) 分类的特征 缺失比例比较严重 可以考虑舍弃把缺失作为单独的分类, 如果之前的数据只有两个分类,那么把缺失考虑进来就变成3个分类算法预测 利用算法预测缺失值 其它特征和要预测的特征之间是否有联系样本数据是否足够利用算法预测缺失值会引入噪声