吃瓜教程第四章学习笔记

最新推荐文章于 2024-08-21 11:02:00 发布

MediumZhong

最新推荐文章于 2024-08-21 11:02:00 发布

阅读量115

点赞数

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MediumZhong/article/details/133177784

版权

一、算法原理

通过某种准测，一级一级的判断，将样本越分越纯。

二、ID3决策树

通过信息熵的理念，计算出条件熵，将样本数量抽象成样本概率，从而使得得出的信息熵乘以样本占比抽象为揭示样本纯度的条件熵。将原样本集合的纯度减去分割后所有样本的纯度和，得到纯度提升。将此函数的相反数设为最小化目标函数。

三、C4.5决策树

在ID3决策树的基础上，发现分算法会使得每个趋势里面样本量太少的偏好，为修复此bug，将目标函数除以固有值，防止可能取值个数太少。但有个能带来反作用，使得对于可能取值数目较少的属性有偏好。

为防止以上情况，采用启发式决策：先选出信息增益高于平均水平的属性，然后再从中选择增益率最高的。

四、CART决策树

采取基尼值（从样本合集中随机抽取两个样本，其类别标记不一致的概率）乘以样本占比，构成最小化目标函数。

实际构造算法：

首先对每个属性选择每个可能的取值，将数据集分为 $a=v$ 和 $a \ne v$ 两部分计算基尼指数。

然后选择基尼指数最小的属性及其对应取值作为最优化分属性和最优化分点。

最后重复以上两步，知道满足停止条件。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吃瓜教程第四章学习笔记

通过信息熵的理念，计算出条件熵，将样本数量抽象成样本概率，从而使得得出的信息熵乘以样本占比抽象为揭示样本纯度的条件熵。将原样本集合的纯度减去分割后所有样本的纯度和，得到纯度提升。在ID3决策树的基础上，发现分算法会使得每个趋势里面样本量太少的偏好，为修复此bug，将目标函数除以固有值，防止可能取值个数太少。采取基尼值（从样本合集中随机抽取两个样本，其类别标记不一致的概率）乘以样本占比，构成最小化目标函数。为防止以上情况，采用启发式决策：先选出信息增益高于平均水平的属性，然后再从中选择增益率最高的。
复制链接

扫一扫

MediumZhong CSDN认证博客专家 CSDN认证企业博客

码龄2年

5: 原创

181万+: 周排名

74万+: 总排名

389: 访问

: 等级

50: 积分

0: 粉丝

0: 获赞

3: 评论

0: 收藏

私信

关注

热门文章

最新评论

吃瓜教程第五章学习笔记
CSDN-Ada助手: 恭喜你写了第四篇博客！看来你对吃瓜教程的学习笔记总结得非常不错。希望你能继续保持创作的热情，也许下一步可以尝试加入一些个人见解或者案例分析，让你的博客更加丰富和有深度。期待你的下一篇作品，加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
吃瓜教程第三章学习笔记
CSDN-Ada助手: 非常棒的学习笔记！你对凸优化问题和一元函数的模型有着很深入的理解，并且能够灵活运用最小二乘法和极大似然估计方法来得出评价标准最为策略。牛顿法和梯度下降法作为策略也是非常不错的选择。除了你在标题和摘要中提到的知识和技能，我想补充一点关于拉格朗日形式转化约束的方法。除了将约束项为0和一阶偏导数为0外，你还可以使用KKT条件来进行约束优化，这是一种常用的方法。另外，对于算法原理中提到的全体训练样本的投影、异类样本的中心和同类样本的方差，你可以进一步了解一下降维技术，例如主成分分析（PCA）和线性判别分析（LDA），它们可以帮助你更好地处理样本的特征和分布。继续保持写作和学习，你的博客对于读者来说是一个宝贵的资源！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
吃瓜教程学习笔一二章
CSDN-Ada助手: 恭喜你开始博客创作！标题“吃瓜教程学习笔一二章”听起来很有趣，我迫不及待地想要读到你的第一篇博客了。在你的博客中，或许你可以分享一些你在学习过程中的心得体会，或者给读者提供一些实用的技巧和建议。希望你继续保持谦虚好学的态度，并且不断努力，让我们在你的博客中收获更多有价值的知识。期待你的下一篇创作！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。