基尼系数、熵、信息增益、信息增益率

最新推荐文章于 2024-03-11 15:14:33 发布

真心乖宝宝

最新推荐文章于 2024-03-11 15:14:33 发布

阅读量901

点赞数 3

分类专栏：机器学习知识点

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45069761/article/details/108485527

版权

机器学习知识点专栏收录该内容

17 篇文章 0 订阅

订阅专栏

熵

熵是事件不确定性的度量，如果事件无不确定性，则熵为0，不确定性越大，熵越大

条件熵

在一个条件下，随机变量的不确定性

信息增益

信息增益 = 熵 - 条件熵
表示在一个条件下，信息不确定性减少的程度
缺点：信息增益偏向取值较多的特征

信息增益率

本质：是在信息增益的基础之上乘上一个惩罚参数。特征个数较多时，惩罚参数较小；特征个数较少时，惩罚参数较大。
惩罚参数：数据集D以特征A作为随机变量的熵的倒数，即：将特征A取值相同的样本划分到同一个子集中
缺点：信息增益比偏向取值较少的特征
原因：当特征取值较少时HA(D)的值较小，因此其倒数较大，因而信息增益比较大。因而偏向取值较少的特征

基尼系数

表示在样本集合中一个随机选中的样本被分错的概率，代表了模型的不纯度，衡量不确定性的大小,基尼系数越小，则不纯度越低，特征越好。这和信息增益(比)是相反的

为什么用基尼系数不用熵？

因为熵log运算耗时

参考文章
参考文章1

真心乖宝宝

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基尼系数、熵、信息增益、信息增益率

熵熵是事件不确定性的度量，如果事件无不确定性，则熵为0，不确定性越大，熵越大条件熵在一个条件下，随机变量的不确定性信息增益信息增益 = 熵 - 条件熵表示在一个条件下，信息不确定性减少的程度缺点：信息增益偏向取值较多的特征信息增益率本质：是在信息增益的基础之上乘上一个惩罚参数。特征个数较多时，惩罚参数较小；特征个数较少时，惩罚参数较大。惩罚参数：数据集D以特征A作为随机变量的熵的倒数，即：将特征A取值相同的样本划分到同一个子集中缺点：信息增益比偏向取值较少的特征原因：
复制链接

扫一扫

专栏目录

真心乖宝宝 CSDN认证博客专家 CSDN认证企业博客

码龄5年

84: 原创

25万+: 周排名

182万+: 总排名

13万+: 访问

: 等级

1681: 积分

29: 粉丝

175: 获赞

53: 评论

451: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何判断有向图有环 --＞拓扑排序
Eli A: 下面放个链接疯狂跳转美团和淘宝什么意思
如何判断有向图有环 --＞拓扑排序
陌上迟迟归: 刚刚还把这道题提交给老师下午讲，看了你的，发现完了，我会了，这挺简单我还问老师不会杀了我吧
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化操作，同样GBDT也不需要。以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
GBDT是否需要进行归一化操作？
TingXiao-Ul: 树模型都不需要归一化处理，同样GBDT也不需要，以树模型作基学习器，特征的作用都只是用来分裂节点，scaling不scaling不会影响分裂的结果
git代码回滚
泡面盖饭: 非常不错，感谢楼主的分享

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。