机器学习-有监督学习-分类算法：决策树算法【CART树：分类树(基于信息熵；分类依据：信息增益、信息增益率、基尼系数)、回归树(基于均方误差)】【损失函数：叶节点信息熵和】【对特征具有很好的分析能力】

u013250861

已于 2023-08-31 09:44:08 修改

阅读量1.4k

点赞数

分类专栏： # ML/经典模型文章标签：人工智能机器学习算法

于 2020-11-19 22:18:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/109825977

版权

ML/经典模型专栏收录该内容

26 篇文章 12 订阅 ¥15.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了决策树算法，包括CART树（分类和回归树）的概念，分类树的构建依据如信息熵、信息增益、基尼系数，以及分类树和回归树的区别。通过scikit-learn库展示了分类树的API用法，并探讨了随机森林的构建过程、优点和应用。随机森林是通过集成多个决策树来提高分类准确性和抗过拟合能力。

摘要由CSDN通过智能技术生成

一、决策树概述

注：生产实践中，不使用决策树，太简单，而是使用决策树的升级版：集成学习算法。
集成学习算法有：

Random Forest(随机森林)

Extremely Randomized Forest(极限随机森林)

Adaboost提升树

GBDT(梯度提升树)

XGBoost(极端梯度提升树)

LightGBM

注：企业重要决策，由于决策树很好的分析能力，在决策过程应用较多（比如：XGBoost），可以选择特征。

1、决策树概念

决策树思想的来源非常朴素，程序设计中的条件分支结构就是if-else结构，最早的决策树就是利用这类结构分割数据的一种分类学习方法。
在这里插入图片描述

决策树算法采用的是自顶向下递归

了解本专栏

超级会员免费看

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
机器学习-有监督学习-分类算法：决策树算法【CART树：分类树(基于信息熵；分类依据：信息增益、信息增益率、基尼系数)、回归树(基于均方误差)】【损失函数：叶节点信息熵和】【对特征具有很好的分析能力】

决策树算法采用的是自顶向下递归方法，其基本思想是以信息熵为度量构造一棵值下降最快的树，到叶子节点处熵值为零，此时每个叶节点中的实例都属于同一类。决策树是一种自上而下，对样本数据进行树形分类的过程，由结点和有向边组成。结点分为内部结点和叶结点，其中每个内部结点表示一个特征或属性，叶结点表示类别。从顶部根结点开始，所有样本聚在一起。经过根结点的划分，样本被分到不同的子结点中。再根据子结点的特征进一步划分，直至所有样本都被归到某一个类别（即叶结点）中。决策树：自顶向下，做一个信息熵下降最快的树，使得事件越来越
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。