吃瓜有感-机器学习西瓜书摘要3

jclee

于 2023-02-23 22:52:30 发布

阅读量66

点赞数

分类专栏：机器学习文章标签：人工智能决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jclee/article/details/129191313

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

学习周志华老师《机器学习》西瓜书第4章决策树摘要及笔记。

第4章决策树

决策树是类似于编程中一系列If Else中的判断操作，其基本思想是实现一种分而治之的处理策略。划分的策略主要是“信息增益”，“信息增益率”，“基尼指数”等。信息增益的代表算法是ID3决策树算法，信息增益准则对可取值数目较多的属性有所偏好，为减少此类影响，C4.5决策树算法使用“信息增益率”选择最优划分属性，而CART决策树使用“基尼指数”选择划分属性。

为防止决策树处理过程中产生“过拟合”，可以实施剪枝处理，基本策略有“预剪枝”和“后剪枝”，预剪枝是在决策树生成的过程中进行结点划分前的估计，以决策树泛化性能的提升为依据决定是否停止划分的依据；后剪枝则先生成完整的决策树，然后自底向上对非叶子结点进行再次考察处理，还是以决策树的性能提升为依据判断是否将此子树替换为叶结点。

在决策树中经常用到连续值属性，一般采用二分法进行对连续属性离散化处理。缺失值的处理方式则是一般将同一样本按不同的概率划入到不同的子结点中。

“多变量决策树”用于解决真实分类边界比较复杂时，多段划分才能较好近似的情况。它不为每个非叶子结点寻找一个最优划分属性，而是对属性的线性组合进行测试，试图建立一个合适的线性分类器，试图达到一个很好的决策分类效果。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
吃瓜有感-机器学习西瓜书摘要3

学习周志华老师《机器学习》西瓜书第4章决策树摘要及笔记。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。