下面列举一些最常用的方法
1、根据阈值过滤掉方差小的变量。
2、通过计算变量与标签的相关系数,留下相关性高的特征。
3、根据决策树或者随机森林,选择重要程度高的特征。
4、利用PCA等算法,对数据进行变换,选择区分度最高的特征组合。
特征选择的方法,大部分在sklearn库中有对应的实现。
下面列举一些最常用的方法
1、根据阈值过滤掉方差小的变量。
2、通过计算变量与标签的相关系数,留下相关性高的特征。
3、根据决策树或者随机森林,选择重要程度高的特征。
4、利用PCA等算法,对数据进行变换,选择区分度最高的特征组合。
特征选择的方法,大部分在sklearn库中有对应的实现。