特征工程中缺失值处理 缺失值极多:把该特征直接舍弃非连续特征缺失值适中:把NaN作为一个新类别连续特征缺失值适中:给定一个step,离散化,把NaN作为一个type放入到特征中缺失值较少: 利用填充的方法进行处理,常见的有均值,众数,中位数填充;用sklearn中的RandomForest模型区拟合数据样本训练模型,然后去填充缺失值;拉格朗日插值法