特征选择，熵，条件熵，信息增益

最新推荐文章于 2024-05-14 19:14:50 发布

VIP文章 shen A007

最新推荐文章于 2024-05-14 19:14:50 发布

阅读量1.4k

点赞数

分类专栏：自然语言处理文章标签：决策树算法机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42204397/article/details/107614139

版权

特征选择，熵，条件熵，信息增益

特征选择
例子
熵
条件熵
信息增益
- 例子

特征选择

特征选择是在于选取能够提高分类器学习效率的特征。对于没有分类能力的特征，经验上扔掉这样的特征对最终的分类结果并没有什么大影响。
通常特征选择的准则是信息增益或信息增益比

例子

在这里插入图片描述
上表是有15个样本组成的贷款申请训练数据，数据包含贷款申请人的4个特征（年龄，是否有工作，是否有自己的房子，信贷情况），最后一列是类别。特征选择是决定用哪个特征来划分特征空间，选择哪个特征作为根节点，可能的情况：
在这里插入图片描述
直观上，如果一个特征具有更好的分类能力，或者说按照这一特征将训练数据集分割成子集，使得各个子集在当前条件下有最好的分类，那么就更应该选择这个特征，信息增益就能够很好的表示这一直观的准则。

熵

信息论中，熵表示信息的不确定性，设 $X$ 是一个取有限个值的离散随机变量，其概率分部是：
$P(X = x_i)=p_i,(i=1, 2, ...n)$
熵就是

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
特征选择，熵，条件熵，信息增益

特征选择，熵，条件熵，信息增益特征选择例子熵条件熵信息增益例子特征选择特征选择是在于选取能够提高分类器学习效率的特征。对于没有分类能力的特征，经验上扔掉这样的特征对最终的分类结果并没有什么大影响。通常特征选择的准则是信息增益或信息增益比例子上表是有15个样本组成的贷款申请训练数据，数据包含贷款申请人的4个特征（年龄，是否有工作，是否有自己的房子，信贷情况），最后一列是类别。特征选择是决定用哪个特征来划分特征空间，选择哪个特征作为根节点，可能的情况：直观上，如果一个特征具有更好的分类能力，或
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。