特征工程在数据挖掘中是非常重要的一步,如果特征构建的比较好,对结果将有极大的提升。一般而言,特征工程通常包括7个步骤:异常处理、特征归一化/标准化、数据分桶、缺失值处理、特征构造、特征筛选、降维等。我将各步骤可用的方法整理成了思维导图上传至了百度网盘链接:https://pan.baidu.com/s/1Hs2x8aJ63NoRmMu2RdZt8Q
提取码:5e7s
有需要的伙伴可自取哦。
step1:异常处理
step2:特征归一化/标准化
step3:数据分桶
step4:缺失值处理
step5:特征构造
step6:特征筛选
step7:降维
特征工程包括但不限于上述步骤,通常对一个比赛而言,特征工程所花费的时间通常占到80%,剩下20%是建模时间,特征工程的重要性可见一斑。