特征选择可以分为3种:
目录:
Filter:过滤法
Wrapper:递归特征消除
Embedded:嵌入法
(一)Filter:过滤法
按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征。
1、移除低方差的特征
2、单变量特征选择
①对于分类问题(y离散),可采用:
- 卡方检验
- f_classif
- mutual_info_classif
- 互信息
②对于回归问题(y连续),可采用:
- 皮尔森相关系数
- f_regression,
- mutual_info_regression
- 最大信息系数
(二)Wrapper:递归特征消除