单变量特征选择Univariate feature selection
分别选择每一个特征,衡量该特征与label之间的关系,选择出topk个最重要的特征
该方法可以帮助对数据的理解,但是对特征优化,提高模型的泛化能力不一定有效。
selector = SelectKBest(f_classif, k=5)
f_classif(方差分析的F值):评估特征的指标。一般的,f_regression(单因素线性回归试验)用作回归
chi2卡方检验,f_classif等用作分类
k:选择的特征的个数