分类问题中如何选出好的连续型特征？

最新推荐文章于 2024-11-24 18:36:33 发布

IrismoonWang

最新推荐文章于 2024-11-24 18:36:33 发布

阅读量233

点赞数

本文链接：https://blog.csdn.net/IrismoonWang/article/details/104793687

版权

本文探讨了卡方检验和单因素方差分析中的r2指标在特征选择中的应用，指出卡方检验适用于离散型特征，而r2适用于连续型特征。通过比较r2和互信息挑选出的特征差异，强调了在实际应用中选择合适指标的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://www.cnblogs.com/pinard/p/9032759.html

这篇博文说得很好，这里只是针对第一种过滤法提供一些补充，其中卡方检验适合分类问题中的离散型特征，比如特征取值是1，2，3这种离散值，但不适合连续型特征的情况。连续型特征还有一个指标就是单因素方差分析中的r2 = SSA/SST，即属于不同类别的特征的平均值之间的方差之和/所有数据的方差。在我的数据中，r2和互信息挑出的特征差异很大，这在实际使用中是需要注意的，该选择哪个指标更适合自己的数据。