读书笔记：机器学习（第4章）

foreverbeginnerz

于 2023-01-24 07:51:24 发布

阅读量106

点赞数

分类专栏：读书笔记文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2201_75664784/article/details/128755141

版权

一、两种不同的叶子结点

当前属性集为空，或是所有样本在所有属性上取值相同，无法划分，在这种情形下，我们把当前结点标记为叶结点
- 将其类别设定为该结点所含样本最多的类别
- 这是在利用当前结点的后验分布
当前结点包含的样本集合为空，不能划分，在这种情形下，把当前结点标记为叶结点
- 将其类别设定为其父结点所含样本最多的类别
- 这是把父结点的样本分布作为当前结点的先验分布

二、信息增益(Information gain)怎么来的

信息熵(Information entropy)的定义

$Ent(D)=-\sum_{k=1}^{\left | y \right |}p_{k}log_{2}p_{k}$ ，其中 $p_{k}$ 表示当前样本集合D中第k类样本所占的比例，Ent(D)的值越小，D的纯度越高

信息增益

定义：假设在属性a上对样本集D进行划分，从总的信息熵到各个分支结点信息熵加权和的差值，就是“属性a对样本集D进行划分所获得的信息增益”

计算： $Gain(D,a)=Ent(D)-\sum_{v=1}^{V}\frac {\left | D^{v} \right |}{\left | D \right |}Ent(D^{v})$

代表：ID3

三、信息增益率(Information gain ratio)怎么来的

信息增益准则对可取值数目较多的属性有所偏好，为了减小这种偏好可能带来的不利影响，就要对可取值数目较多的属性进行惩罚，即

最低0.47元/天解锁文章

foreverbeginnerz

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
读书笔记：机器学习（第4章）

重读机器学习（西瓜书）
复制链接

扫一扫

专栏目录

foreverbeginnerz CSDN认证博客专家 CSDN认证企业博客

码龄2年

10: 原创

130万+: 周排名

127万+: 总排名

1748: 访问

: 等级

107: 积分

81: 粉丝

5: 获赞

7: 评论

3: 收藏

私信

关注

热门文章

分类专栏

读书笔记 4篇
NLP 2篇
论文笔记 6篇

最新评论

论文笔记：Transformer
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：BERT
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记：Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)使用标准目录。
论文笔记：Learning Deep Features for Discriminative Localization
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录。
论文笔记：Visualizing and Understanding Convolutional Networks
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。