《scikit-learn机器学习》决策树① - 算法原理+信息增益【信息熵的具体运算】

最新推荐文章于 2022-07-05 14:50:26 发布

Bessie_Lee_gogogo

最新推荐文章于 2022-07-05 14:50:26 发布

阅读量683

点赞数 1

分类专栏：学习ML+DL 文章标签：机器学习算法 scikit-learn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42198265/article/details/121384043

版权

学习ML+DL 专栏收录该内容

45 篇文章 17 订阅

订阅专栏

文章目录

1、决策树原理
2、信息增益

1、决策树原理

选择一个特征进行测试，然后根据这个测试再分为多个子数据集，最后一步步划分数据集。
一个很典型的图片：
在这里插入图片描述

但是我们如何选择哪些特征分布，以什么为标准呢？
由于要解决这个问题，我们引入了信息增益

2、信息增益

2.1 信息熵

信息熵这个词汇是由香农于1948年提出的，这个词是香农从热力学中借用过来的。
我们可以根据信息熵的一个变化幅度去衡量我们到底先使用哪个特征作为第一个，哪个作为后一个。.

2.2 公式

在这里插入图片描述

2.3 例子

在这里插入图片描述

2.4 具体实例

在这里插入图片描述

2.5 结论

在这里插入图片描述

2.6 sklearn作者寄语

在这里插入图片描述

Bessie_Lee_gogogo

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
《scikit-learn机器学习》决策树① - 算法原理+信息增益【信息熵的具体运算】

决策树原理：选择一个特征进行测试，然后根据这个测试再分为多个子数据集，最后一步步划分数据集。但是我们如何选择哪些特征分布，以什么为标准呢？由于要解决这个问题，我们映入
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Bessie_Lee_gogogo 你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。