决策树思维方式及实现过程（1）

最新推荐文章于 2023-11-06 21:59:01 发布

Fitz_p

最新推荐文章于 2023-11-06 21:59:01 发布

阅读量865

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fitz_p/article/details/86756509

版权

机器学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

本文介绍了决策树的思维方式，强调其模拟人类决策过程，通过信息增益来评估因素影响程度，并详细阐述了如何利用信息增益递归构建决策树，逐步提升样本集合纯度以达到分类目的。

摘要由CSDN通过智能技术生成

1.决策树是模拟人决策过程，按因素影响程度从大到小，依次决策，得出最终结论。

如下图：为分类一封邮件是否为垃圾邮件

2.如何评判因素的影响程度

a.评判影响程度的一种方法是信息增益，信息增益越大，表示该因素的影响程度越高，用该因素决策，越容易到达结论（只剩下单一可能类别）

b.信息的定义：如果待分类的事物可能划分在多个分类之中，则符号xi的信息定义为：

c.熵：信息的期望值。熵是度量样本集合纯度最常用的指标。为了计算熵，我们需要计算所有类别所有可能包含的信息期望值：

其中，y表示事物总共有y个分类，第k类事物的概率表示为pk ，所有类别的信息分别乘以各自的概率然后累加，得到的就是信息的期望，即熵

d.信息增益：可以理解为样本集合划分前的熵和样本集合用属性a划分之后的加权熵的差，加权系数为 |Dv| / |D|

其中，V表示属性a上有 V个不同的取值，Dv为属性a=v的样本集合，属于样本集合D的子集；

Dv上可以包含事物的多个分类，Ent（Dv）为Dv上的信息熵。

加权系数w=|Dv| / |D| ，即Dv的样本数 / D的样本数

3.递归构建决策树：决策树算法，首先利用信息增益，量化因子的影响程度，然后从影响程度最大的因子出发，依次判断，逐渐提升样本集合纯度，最后得出分类结论。构建过程如下：

Line2 if D中的样本全同属于一个类别C，如西瓜分为好瓜坏瓜，此时D中的样本全为好瓜

Line5 if D中样本在A上取值相同，A中有d个属性，但此时d个属性的划分结果全为好瓜，即取值相同；D中的样本可以有坏瓜，在属性a 下，k类的样本最多，此时将a的取值标记为k

Line8 从A中选择最优划分属性a*，即遍历属性集A，计算a1，a2,….，ad的信息增益，信息增益最大的属性为最优划分属性；

Line9，line10 a*属性中，有n个不重复属性值，对每个属性值node生成一个分支，令Dv表示D上a*=av的样本子集

Line14 递归划分。

下一篇我们将讲到如何用代码实现决策树

参考资料：机器学习--周志华

参考资料：机器学习实战

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Fitz_p CSDN认证博客专家 CSDN认证企业博客

码龄7年

30: 原创

14万+: 周排名

150万+: 总排名

7万+: 访问

: 等级

956: 积分

10: 粉丝

23: 获赞

15: 评论

99: 收藏

私信

关注

热门文章

分类专栏

java 1篇
Mysql 1篇
每天学点算法 2篇
Tensorflow 4篇
强化学习 3篇
python 11篇
linux 1篇
爬虫 1篇
人工智能 14篇
神经网络 7篇
机器学习 19篇
android 1篇
recyclerview 2篇
listview 2篇
算法 7篇
数据结构 5篇

最新评论

每天学点算法->强化学习->Q_learning走迷宫
ℳjokerい: 作者大大你好，就是环境那块红色方块怎么移动不太明白 def step(self, action): s = self.canvas.coords(self.rect) base_action = np.array([0, 0]) if action == 0: # up if s[1] > UNIT: base_action[1] -= UNIT elif action == 1: # down if s[1] < (MAZE_H - 1) * UNIT: base_action[1] += UNIT elif action == 2: # right if s[0] < (MAZE_W - 1) * UNIT: base_action[0] += UNIT elif action == 3: # left if s[0] > UNIT: base_action[0] -= UNIT self.canvas.move(self.rect, base_action[0], base_action[1]) # move agent 能稍微讲解一下它的意思吗，例如action==0，s[1]>UNIT,base_action[1]-=UNIT 麻烦作者大大指点一下，不太明白它这个具体怎么动的
svc实战fashion-mnist图像分类
秋雨寂庭: 感谢博主~~
每天学点算法->强化学习->Q_learning走迷宫
DoPamine...: 为什么我无法运行呢，maze_env库那里出现了问题
每天学点算法->强化学习->Q_learning走迷宫
MaxxJ1e 回复 Fitz_p: 我知道，我换个问法吧。怎么将tkinter里的坐标[a,b,c,d]对应成我们可以理解的(x,y)坐标形式呢？
每天学点算法->强化学习->Q_learning走迷宫
Fitz_p 回复 MaxxJ1e: S_是坐标，环境里搜这行代码：s_ = self.canvas.coords(self.rect)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。