python方差特征选择_使用scikitlearn进行方差分析的特征选择和交叉验证

最新推荐文章于 2023-11-28 10:59:20 发布

weixin_39796238

最新推荐文章于 2023-11-28 10:59:20 发布

阅读量910

点赞数

文章标签： python方差特征选择

scikitlearn有一种递归的特征消除和交叉验证的选择方法，称为RFECV。以下代码仅供参考，与给定的示例on this link相似。在import matplotlib.pyplot as plt

from sklearn.svm import SVC

from sklearn.cross_validation import StratifiedKFold

from sklearn.feature_selection import RFECV

svc = SVC(kernel="linear")

rfecv = RFECV(estimator=svc, step=1, cv=StratifiedKFold(labels, 50),

scoring='precision')

rfecv.fit(features, labels)

print("Optimal number of features : %d" % rfecv.n_features_)

print rfecv.support_

features=features[:,rfecv.support_]

# Plot number of features VS. cross-validation scores

plt.figure()

plt.xlabel("Number of features selected")

plt.ylabel("Cross validation score (nb of correct classifications)")

plt.plot(range(1, len(rfecv.grid_scores_) + 1), rfecv.grid_scores_)

plt.show()

样本输出：

参考链接：

编辑：使用变异数分析(ANOVA)进行特征选择

为了使用方差分析和交叉验证，您需要使用Pipeline、Select Percentile和{a9}。基于给定的示例here，您可以结合这些技术来使用CV+Annova测试进行特征选择。在

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注