语法:
SelectKBest(…)
类型:
sklearn.feature_selection.univariate_selection模块中的函数,根据k最高分数选择特征。在用户指导中读取更多。
输入参数;
- 参数名:score_func
- 类型:callable
说明:函数使用两个数组x和y,并返回一对数组(分数,p值)或者一个带有分数的驻足,默认是 f_classif(参加下面的参见),默认函数只适用于分类任务。
参数名:k
- 类型: int or “all”, optional, default=10
- 说明:要选的最优特征的数量,”all”选项绕过选择,用于参数搜索。
属性:
- 参数名:scores_
- 类型:array-like, shape=(n_features,)
说明:特征的分数
参数名:pvalues_
- 类型:array-like, shape=(n_features,)
- 说明:特征值的p值,如果score_func只返回分数,则没有。
笔记:
分数相等的特征之间的联系将以一种不确定的方式被打破。
参阅:
- f_classif:用于分类任务的标签/特性之间的ANOVA f值。 .
- mutual_info_classif: 一个离散目标的相互信息。 .
- chi2: 用于分类任务的非负特性的卡方统计。 .
- f_regression:用于回归任务的标签/特性之间的f值。
- mutual_info_regression: 连续目标的相互信息。
- SelectPercentile: 根据最高分数的百分位数选择特征。
- SelectFpr:根据错误的正速率测试选择特性。
- SelectFdr: 根据估计的错误发现率选择特性。
- SelectFwe: 选择基于整体错误率的特征。
- GenericUnivariateSelect: 具有可配置模式的单变量特征选择器。