Day 51: 决策树和案例

最新推荐文章于 2023-05-22 00:05:15 发布

VIP文章 Garciaxx

最新推荐文章于 2023-05-22 00:05:15 发布

阅读量206

点赞数

分类专栏：学习成长学习记录学习笔记文章标签：机器学习深度学习自然语言处理决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50192514/article/details/116770212

版权

Python 回忆录

2020/05/13
- 决策树

2020/05/13

决策树

决策树其实就是一直不断地if else 条件筛选。但是那个条件放在开始哪个条件放在最后这就有一个条件的权重问题了。这时候就会有信息增益和信息熵的概念

信息熵

在这里插入图片描述
就是特征的不确定性，算是一个概率问题。比如32支球队争夺冠军。在不知道任何球队信息的时候，每个球队得到冠军的概率d都是一样 1/32，所以信息熵就是log32 就是5比特。当假如知道哪个球队强的话改变了那支球队获胜的概率那么这个信息熵就会比5比特小。
所以说信息和消除不确定性是相关的 信息熵越大，不确定性越大，最后结果就容易预测不准确

信息增益

所以说：当得到一个信息对信息熵减小的程度就叫信息增益也就是能对增加预测结果的概率那就是信息增益。
在这里插入图片描述

练习使用

在这里插入图片描述
一个银行贷款审核表，能不能贷款是目标特征。先确定下信息熵 H(类别)=-（9/15log(9/15) - 6/15log(6/15)≈ 0.971. 这个信息熵也就是信息增益公式中的H(D)
计算出每个类别的信息增益：年龄特征有青年，中

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
6
评论
Day 51: 决策树和案例

Python 回忆录2020/05/13决策树信息熵信息增益2020/05/13决策树决策树其实就是一直不断地if else 条件筛选。但是那个条件放在开始哪个条件放在最后这就有一个条件的权重问题了。这时候就会有信息增益和信息熵的概念信息熵就是特征的不确定性，算是一个概率问题。比如32支球队争夺冠军。在不知道任何球队信息的时候，每个球队得到冠军的概率d都是一样 1/32，所以信息熵就是log32 就是5比特。当假如知道哪个球队强的话改变了那支球队获胜的概率那么这个信息熵就会比5比特
复制链接

扫一扫

专栏目录

Garciaxx CSDN认证博客专家 CSDN认证企业博客

码龄4年

59: 原创

43万+: 周排名

195万+: 总排名

1万+: 访问

: 等级

620: 积分

6: 粉丝

8: 获赞

31: 评论

19: 收藏

私信

关注

热门文章

分类专栏

学习记录 58篇
学习成长 38篇
学习笔记 56篇
面经 1篇
面试 1篇

最新评论

Day 34 ：数据合并Join，Merge
weixin_51528442: 我虽然不敢说很懂, 但是我认为能把join和merge总结成相同行和相同列的人应该还没太懂我姑且提出一个假设, 会不会join和merge有一些参数可以设置?有没有可能join和merge都可以做到指定索引列, 进行索引相同行的拼接?
2021顺丰科技实习面经
m0_72457667: 朋友了解下丰图科技实习体验如何
Day 54:过拟合和欠拟合
大家一起学编程（python）: 别问，问就是好文
Day 54:过拟合和欠拟合
Garciaxx: 谢谢你的博客也很棒！
Day 54:过拟合和欠拟合
Garciaxx: 谢谢~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。