ID3、C4.5、CART算法

最新推荐文章于 2022-10-22 00:15:00 发布

小金子的夏天

最新推荐文章于 2022-10-22 00:15:00 发布

阅读量305

点赞数

分类专栏：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WangYouJin321/article/details/104937161

版权

笔记专栏收录该内容

50 篇文章 3 订阅

订阅专栏

熵度量了事物的不确定性，越不确定的事物，它的熵就越大。
ID3:用信息增益大小来判断当前节点应该用什么特征来构建决策树，
用计算出的信息增益最大的特征来建立决策树的当前节点。

ID3算法有四个主要的不足，
一是不能处理连续特征，
第二个就是用信息增益作为标准容易偏向于取值较多的特征，
最后两个是缺失值处理的问和过拟合问题。

C4.5：信息增益率 = 信息增益和特征熵的比值

CART分类树算法：使用基尼系数来代替信息增益比，基尼系数代表了模型的不纯度，基尼系数越小，
则不纯度越低，特征越好。

ensamble 集成学习
1.bagging 代表是随机森林，数据随机（有放回）、特征随机，每棵树之间的权重不人为控制的话是相同的
2. boosting adaboosting 一棵树的输出作为另外一棵树的输入，有两个权重，一个是被错分的样本在下次训练的时候的比重会大，也就是重点关照那些被错分了的；还有一个权重是没棵树的权重，可以利用错误率通过公示计算
3. gbdt 是boosting的一种工业界用的效果比较好的，实际上是用作回归，每次学习的是预测值与真实值之间的残差
4.xg boost 本质上还是gbdt，效率速度发挥到极致；
a. 使用l1 l2 防止overfitting
b. 对代价函数一阶二阶求导
c.树长全后从底部向上减支，防止算法贪婪

小金子的夏天

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
ID3、C4.5、CART算法

熵度量了事物的不确定性，越不确定的事物，它的熵就越大。ID3:用信息增益大小来判断当前节点应该用什么特征来构建决策树，用计算出的信息增益最大的特征来建立决策树的当前节点。ID3算法有四个主要的不足，一是不能处理连续特征，第二个就是用信息增益作为标准容易偏向于取值较多的特征，最后两个是缺失值处理的问和过拟合问题。C4.5：信息增益率 = 信息增益和特征熵的比值CART分类树算法：使用...
复制链接

扫一扫

专栏目录

小金子的夏天 CSDN认证博客专家 CSDN认证企业博客

码龄12年

349: 原创

3万+: 周排名

19万+: 总排名

62万+: 访问

: 等级

6583: 积分

122: 粉丝

259: 获赞

61: 评论

1396: 收藏

私信

关注

热门文章

分类专栏

最新评论

隐私计算关键技术：隐私集合求交（PSI）原理介绍
库卡卡啦: 为啥是1.2n呢？
(转）pyflink实时接收kafka数据至kafka的其他topic
小金子的夏天: 无法加，你有身份验证
pyflink实时接收kafka数据至hive
lzj173776: set_value_only_deserializer(SimpleStringSchema())兄弟你知道如何自定义反序列化吗？因为我接受的kafka数据类型是字节，字符串会出现乱码，因此SimpleStringSchema()就不能用啦！如果兄弟会的话可以加我QQ吗？ 1124533061
(转）pyflink实时接收kafka数据至kafka的其他topic
lzj173776: set_value_only_deserializer(SimpleStringSchema())兄弟你知道如何自定义反序列化吗？因为我接受的kafka数据类型是字节，字符串会出现乱码，因此SimpleStringSchema()就不能用啦！如果兄弟会的话可以加我QQ吗？ 1124533061
拉格朗日插值——基于scipy实现
weixin_51528442: 为啥我输出的结果不是系数列表而是手写形式??? 输出两行, 第一行是次数3 2 1, 第二行是多项式的系数和底

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小金子的夏天 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。