【机器学习】决策树

DonngZH

于 2023-02-20 15:23:08 发布

阅读量4.9k

点赞数

分类专栏：人工智能深度学习机器学习文章标签：机器学习决策树算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44750512/article/details/129121442

版权

深度学习同时被 3 个专栏收录

75 篇文章 41 订阅

订阅专栏

53 篇文章 5 订阅

订阅专栏

21 篇文章 2 订阅

订阅专栏

1. 决策树简介

不同于逻辑回归，决策树属于非线性模型，可以用于分类，也可用于回归。可以被认为是if-then规则的集合，以信息增益（信息增益比、基尼系数）为度量构建一个度量标准下降最快的树，每个节点都代表一个属性的判断，每个分支代表一个判断结果的输出，直到叶子节点只剩下同一类别的样本，最后每个叶节点代表一种分类结果。

决策树的学习包括三个重要过程：

（1）特征选择：常用的特征选择有信息增益、信息增益比、基尼系数等。

（2）生成过程：通过计算信息增益或者是其他指标，选择最佳特征。从根节点开始，

（3）剪枝过程：首先定义决策树的评价指标，对于所有的叶子节点，累加计算每个叶子节点中（样本数）和其（叶子节点熵值）的乘积，以叶子数目作为正则项。

2.决策树优缺点

2-1 优点

1. 可同时用于分类和回归任务，且可以处理多分类问题；

2. 不需要归一化，减少了数据预处理工作；

3. 自动筛选变量，容易解释和可视化决策过程；

4. 适合处理高维度数据。

2-2 缺点

1. 不稳定，泛化性能差；

2. 没有考虑变量之间的相关性，每次筛选都只考虑一个变量；

3. 只能线性分割数据；

4. 本质上是贪婪算法（可能找不到最优的树）。

3. 决策树算法简介

3-1 算法简介

1、ID3与C4.5采用信息熵作为选择准则的基础（ID3采用信息增益，C4.5采用信息增益率），CART选择基尼指数作为选择准则的基础（分类树采用基尼指数，回归树采用方差，用最小二乘法求解）。

2、ID3和C4.5只用于分类，CART可以用于分类与回归。

3、ID3和C4.5可以是多叉树，CART是二叉树。

4、ID3只能使用离散特征，C4.5和CART可以处理连续特征。

5、ID3不能处理缺失值，C4.5可以处理缺失值。

3-2 算法介绍

3-2-1 ID3

【机器学习】决策树-ID3算法_DonngZH的博客-CSDN博客

3-2-2 C4.5

【机器学习】决策树-C4.5算法_DonngZH的博客-CSDN博客

3-2-3 Gini

【机器学习】决策树-Gini指数_DonngZH的博客-CSDN博客

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】决策树

不同于逻辑回归，决策树属于非线性模型，可以用于分类，也可用于回归。可以被认为是if-then规则的集合，以信息增益（信息增益比、基尼系数）为度量构建一个度量标准下降最快的树，每个节点都代表一个属性的测试，知道叶子节点处只剩下同一类别的样本。决策树的学习包括三个重要过程：（1）特征选择：常用的特征选择有信息增益、信息增益比、基尼系数等。（2）生成过程：通过计算信息增益或者是其他指标，选择最佳特征。从根节点开始，
复制链接

扫一扫

专栏目录

DonngZH CSDN认证博客专家 CSDN认证企业博客

码龄5年

167: 原创

2万+: 周排名

1万+: 总排名

79万+: 访问

: 等级

2768: 积分

520: 粉丝

933: 获赞

224: 评论

4034: 收藏

私信

关注

热门文章

分类专栏

人工智能 53篇
深度学习 75篇
机器学习 21篇
机器翻译 1篇
剑指offer 28篇
Linux 6篇
Django 8篇
Fabric2.0部署 6篇

最新评论

【深度学习】Multi-Head Attention 原理与代码实现
GWZZJARVIS: +1，是这么回事
【工程实践】解决 nvcc: command not found
qq_52846410: 是的，给作者一个大大的赞我是自己在租的服务器上面安装新的cuda遇到的问题，其实就是服务器原有一个cuda包，这里暂且理解成建立连接，默认搭建到想使用的cuda版本，librarypath和path
【深度学习】使用Fairseq进行机器翻译
KennysQ1: 博主我在对测试集进行生成式翻译的时候报错： RuntimeError: Mask Type should be defined 百度之后说是缺少mask，请问这个怎么解决呢？
【深度学习】Pytorch模型转成Onnx
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
【工程实践】np.loadtxt()读取数据
YesPMPYesPMP: 互联网众包平台Yespmp，帮助项目实现落地。平台提供全方位的服务，包括IT项目开发、运营推广、创意设计、灵活用工等多个领域。它为项目发包方和接包服务商提供了一个交流和合作的平台，帮助双方找到合适的合作伙伴，解决项目管理中的各种痛点，如项目风险高、成本和进度控制困难等。同时，平台还提供项目监理、开发工具包、虚拟课堂等支持，帮助项目从设计到开发再到运营的整个周期顺利实施。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。