不同模型有不同的数据要求,一些步骤可能需要也可能不需要 一般来说是用 tree 模型和 LR 之类的简单模型 树模型 由于 lgb 的强大,不需要归一化,数据分桶,类别 onehot 等 特征构造完,就可以保存数据文件了 简单模型 如 Ridge 和 LR,就需要进行数据分桶、归一化、类别 onehot 了