一、缺失值填充方法: 零值填充平均值/中位数填充(该属性的平均值/中位数;与该元组属同一类的所有样本的均值/中位数)忽略元组推理(回归预测等) 二、噪声数据 三、去重 四、数据降维 主成分分析GBDT相关性分析因子分解 五、数据抽样 六、衍生特征