机器学习之——决策树（1）算法思想

最新推荐文章于 2021-10-26 21:58:54 发布

j_jiajia

最新推荐文章于 2021-10-26 21:58:54 发布

阅读量605

点赞数

分类专栏： python 文章标签： python 决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/j_jiajia/article/details/89716953

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

机器学习中分类和预估算法的评估：

准确率
速度
强壮性
可规模性
可解释性

——————————————————————————————
1.什么是决策树/判定树（decision tree）？
每个内部节点代表在一个属性上的测试
每个分支代表一个属性输出
每个树叶结点代表类或者类分布
树的最顶层是根节点
图1-决策树

2.机器学习中分类算法的一个重要算法
3.构造决策树的基本算法
3.1熵概念：
信息和抽象，如何度量？
一条信息的信息量的大小和他的不确定性有直接关系，要搞清一件非常非常不确定的事情，或者一无所知的事情，需要大量的信息==》信息量的度量就等于不确定性的多少。
比特（bit）来衡量信息的多少，

在这里插入图片描述
变量的不确定性越大，熵也就越大。

3.1决策树归纳算法（ID3）
选择属性判断节点：
信息获取量：Gain(A)=Info_(D)-Info_A(D)
通过A来作为节点分类获取了多少信息
如：结果：共14个，有5个不买电脑，9个买电脑
在这里插入图片描述

3.1其他算法：
C4.5
CART
区别：属性选择的度量方法不同
3.2如何处理连续变量的属性？
将其离散化
4.树剪枝叶（避免overfitting）
4.1先剪枝
4.2后剪枝

5.决策树优点：直观，便于理解，小规模数据有效
缺点：处理连续变量不好，类别较多时，错误增加的比较快，可规模性一般

—————————————————————————————————

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之——决策树（1）算法思想

机器学习中分类和预估算法的评估：准确率速度强壮性可规模性可解释性——————————————————————————————1.什么是决策树/判定树（decision tree）？每个内部节点代表在一个属性上的测试每个分支代表一个属性输出每个树叶结点代表类或者类分布树的最顶层是根节点2.机器学习中分类算法的一个重要算法3.构造决策树的基本算法3.1熵概念：信息和...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。