https://www.cnblogs.com/pinard/p/9032759.html
这篇博文说得很好,这里只是针对第一种过滤法提供一些补充,其中卡方检验适合分类问题中的离散型特征,比如特征取值是1,2,3这种离散值,但不适合连续型特征的情况。连续型特征还有一个指标就是单因素方差分析中的r2 = SSA/SST,即属于不同类别的特征的平均值之间的方差之和/所有数据的方差。在我的数据中,r2和互信息挑出的特征差异很大,这在实际使用中是需要注意的,该选择哪个指标更适合自己的数据。
https://www.cnblogs.com/pinard/p/9032759.html
这篇博文说得很好,这里只是针对第一种过滤法提供一些补充,其中卡方检验适合分类问题中的离散型特征,比如特征取值是1,2,3这种离散值,但不适合连续型特征的情况。连续型特征还有一个指标就是单因素方差分析中的r2 = SSA/SST,即属于不同类别的特征的平均值之间的方差之和/所有数据的方差。在我的数据中,r2和互信息挑出的特征差异很大,这在实际使用中是需要注意的,该选择哪个指标更适合自己的数据。