五.分类:决策树问题

最新推荐文章于 2022-08-10 16:02:34 发布

唐-import-某人

最新推荐文章于 2022-08-10 16:02:34 发布

阅读量231

点赞数

分类专栏：机器学习文章标签： python 数据挖掘决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tyh751734196/article/details/116998710

版权

机器学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

一.决策树结构

1案例分析

例题
树方案

二.要点认知

1.纯度认知确

样本中没有两项属于同一类
样本中所有项都属于同一类
- 如图可知，所有的点属于地球的同一类。
- 如图可知，各个国的点不属于非本国的同一类。

2.定样本集的拆分属性

样本集拆分的分类结果尽可能的单一，多数类占优
衡量集和的纯度，依照纯度进行拆分

3.纯度量化

基尼系数（Gini总体发散性）CART
熵（entropy，信息量,近0则优）
- 明确信息消耗的多少
信息增益 （Gain）ID3
- 对纯度提升的程度
信息增益率 C4.5，C5.0

4.ID3步骤

（1）计算

计算当前样本，所有属性的信息信息增益

（2）选择

选择信息增益最大的做为拆分属性，将拆分属性相同的归为同一子样本集

（3）判断（递归）

若拆分属性分类不是单一，继续进行ID3操作，直至属性分类单一、

5.算法比较

算法	解释	适用
ID3	以信息熵增益为衡量标准（选取大的）	确定结点应采用的属性
C4.5	以信息增益率为衡量标准（选取大的）	离散描述属性连续描述属性
C5.0	C4.5加强版	大数据集
CART	通过构建树,修剪树,评估树来构建二叉树	回归树: 终结点连续变量, 分类树: 终结点分类变量

三.实战

1.DecisionTreeClassifier解析

参数	解释	接收	默认
criterion	衡量分裂质量的功能	信息增益/基尼系数	‘gini’
splitter	节点拆分策略	str	‘best’
max_depth	树最大深度	int	None
min_samples_split	拆分内部节点所需的最小样本数	int	2
min_samples_leaf	叶节点最小样本数	int	1
min_weight_fraction_leaf	叶节点处的权重总和中的最小加权分数	float	0.0
random_state	估计器的随机性随机拆分样本	int	None

唐-import-某人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
五.分类:决策树问题

一.决策树结构1案例分析例题树方案二.要点认知1.纯度认知确样本中没有两项属于同一类样本中所有项都属于同一类如图可知，所有的点属于地球的同一类。如图可知，各个国的点不属于非本国的同一类。2.定样本集的拆分属性样本集拆分的分类结果尽可能的单一，多数类占优衡量集和的纯度，依照纯度进行拆分3.纯度量化基尼系数（Gini总体发散性）CART熵（entropy，信息量,近0则优）明确信息消耗的多少信息增益（Gain）ID3对纯度提升的程度
复制链接

扫一扫

专栏目录

唐-import-某人 CSDN认证博客专家 CSDN认证企业博客

码龄4年

重庆国际复合材料股份有限公司

69: 原创

8万+: 周排名

8万+: 总排名

4万+: 访问

: 等级

948: 积分

214: 粉丝

276: 获赞

1: 评论

347: 收藏

私信

关注

热门文章

分类专栏

最新评论

一.大数据分析与处理概论
阿里数据专家: AIGC ChatGPT ，BI商业智能，可视化Tableau, PowerBI, FineReport，数据库Mysql Oracle， Office， Python ，ETL Excel 2021 实操，函数，图表，大屏可视化案例实战 http://t.csdn.cn/zBytu
第2章物理层——4.信道复用技术
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/616585350。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

唐-import-某人 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。