【机器学习】决策树算法--1(算法介绍)

weixin_51978164

已于 2022-11-12 16:26:54 修改

阅读量357

点赞数

文章标签：人工智能算法

于 2022-11-12 14:14:36 首次发布

本文链接：https://blog.csdn.net/weixin_51978164/article/details/127806288

版权

本文介绍了决策树的基本原理和三种典型算法：ID3、C4.5和CART。通过对数据集的分析，阐述了信息熵、信息增益、增益率和基尼指数的概念，以及它们在决策树构建过程中的作用。ID3算法以信息增益为准则，C4.5引入增益率避免偏好取值多的属性，而CART算法采用基尼指数作为划分标准。

摘要由CSDN通过智能技术生成

一、决策树的是什么？

1.是⼀种树形结构，本质是⼀颗由多个判断节点组成的树
2.每个内部节点表示⼀个属性上的判断
3.每个分⽀代表⼀个判断结果的输出
4.最后每个叶节点代表⼀种分类结果

决策树算法基本原理是用决策点代表决策问题，用方案分枝代表可供选择的方案，用概率分枝代表方案可能出现的各种结果，经过对各种方案的各种结果的比较，为决策者提供决策依据。

名称	分支方式	提出时间	备注
ID3	信息增益	1975	只能对离散数据集进行构建决策树
C4.5	信息增益率	1993	优化解决ID3分支过程中总是偏向分类多的属性
CART	Gini系数	1984	可以进行分类回归，可以处理离散数据集，也可以处理连续数据集

                            集美大学三好学生评选表

—	是否挂科	获得奖学金次数	综测评价	体质健康是否达标	宿舍检评	是否符合条件
1	no	4	excellect	yes	excellent	yes
2	no	1	good	no	excellent	no
3	no	0	excellect	yes	excellent	yes
4	no	1	excellect	no	excellent	no
5	no	2	good	yes	excellent	yes
6	no	1	excellect	yes	excellent	no
7	no	1	excellect	yes	excellent	yes
8	yes	0	good	yes	excellent	no
9	no	2	good	yes	good	no
10	no	2	excellect	yes	excellent	yes
11	yes	2	excellect	yes	excellent	no
12	yes	0	good	yes	good	no
13	yes	0	excellect	yes	pass	no
14	no	4	excellect	yes	excellent	yes
15	no	2	excellect	yes	excellent	yes