第5章决策树

最新推荐文章于 2022-08-18 22:45:08 发布

xc_bnu

最新推荐文章于 2022-08-18 22:45:08 发布

阅读量317

点赞数

分类专栏：专业书籍文章标签：统计学习方法

本文链接：https://blog.csdn.net/xc_bnu/article/details/80966824

版权

专业书籍专栏收录该内容

5 篇文章 0 订阅

订阅专栏

5.1 决策树模型与学习

5.2 特征选择

目的：选取的特征对训练数据有分类作用

特征选择的准则：信息增益或信息增益比

信息增益：输入对训练数据分类不确定性减少的程度，信息增益越大越好

g(D,A)=H(D)-H(D|A)

信息增益比：

5.3 决策树的生成

1）ID3算法

求所有特征关于训练数据的信息增益，选最大值作为当前结点

叶子结点：当前结点将训练数据划分为两个子集，当某个子集只有同一类样本点时则为叶子结点

2）C4.5的生成算法

与ID3算法的不同是用的信息增益比

5.4 决策树的剪枝

损失函数

5.5 CART算法

1） CART生成

最小二乘回归树的生成：

策略：损失函数是平方误差

算法：启发式（1.遍历（j,s），选损失函数最小的切分点 2.对应输出是均值）

CART的生成：

策略：基尼指数（选择最小）

算法：算出特征对于当前数据集的基尼指数，选择最小的基尼指数的特征及其对应的切分点

2）CART剪枝

策略：损失函数：如基尼指数等

算法：比较剪枝前后损失函数哪个小就选择哪个剪枝

或者当损失函数相同时，算出相应当a，再对树进行剪枝

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xc_bnu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

决策树模型总结

Forbes_Zhong的博客

07-21

6413

1 决策树定义 决策树分为分类决策树和回归决策树。分类决策树应用范围比较广，其核心思想就是在一个数据集上找到一个最优的特征，然后从这个特征的选值中找到一个最优的候选值，根据这个最优候选值将数据集划分为两个子数据集，然后递归上述操作，直到满足指定条件为止。以下主要介绍分类决策树。 决策树的生成过程主要包括三步：特征选择，决策树生成以及决策树剪枝。 2 决策树的特征选择和生成方法 决策树的特征...

决策树算法(1)--特征选择标准

SPACESTUDIO的博客

02-03

5812

先举一个简单的例子理解一下决策树算法：父母为孩子选择学校，会了解多个学校的教学水平、学校设施等“条件”，假设有一家有足够选择能力的父母认为教学水平是第一位的，而设备等次之，且将教学水平分为了一般、较好、优良三个档次，对于教学水平一般者不予考虑，优良者趋之若鹜，而较好者则根据其学校设施好坏决定去留。这个例子可以表示为如下的树形结构，这一思路也就称为“决策树”。 ...

参与评论您还未登录，请先登录后发表或查看评论

决策树

仰望星空

08-16

650

决策树是一种自上而下，对样本数据进行树形分类的过程，由节点和有向边组成。决策树作为最基础、最常见的有监督学习模型，常被用于分类问题和回归问题，在市场营销和生物医药等领域尤其受欢迎，主要是因为树形结构与销售、诊断等场景下的决策过程非常相似，决策树具有简单直观、解释性强的优点。

机器学习+模式识别学习总结（四）——决策树

aibeeeee的博客

01-22

1361

一、定义及介绍 1、分类决策树模型是一种描述对实例进行分类的树形结构，由结点+有向边组成。结点分为内部结点(表示一个特征/属性)和叶结点(表示一个类)。【树的总结构包括：根结点、非叶子结点、叶子结点、分支】 2、if-then规则：从根结点到叶结点的每一条路径构建一条规则，路径上内部结点的特征对应规则的条件，叶结点的类对应着规则的结论。if-then规则集合的重要性质：互斥且完备。这个规则的意识也就是从根结点出发，最终都有且只有一条路径到达某一个具体的叶结点，并且不会出现实例无法分类的情况。 3、决策

斯坦福大学机器学习——特征选择（Feature selection）

linkin1005的专栏

01-22

2万+

特征选择是一种及其重要的数据预处理方法。假设你需要处理一个监督学习问题，样本的特征数非常大，但是可能仅仅有少部分特征会和对结果产生影响。甚至是简单的线性分类，如果样本特征数超过了n，但假设函数的VC维确仍然是O(n)，那么，除非大大扩展训练集的数量，否则即会带来过拟合的问题。在这样的情况下，可以使用特征选择算法降低特征的数量。

第5章决策树2

08-03

总结起来，本章重点涵盖了决策树的熵和信息增益、集成学习中的随机森林和Boosting，以及它们在客户离网预测问题中的应用。理解这些概念和方法对于构建强大的分类模型至关重要。在实践中，我们需要结合理论知识与实际...

第5章决策树1

08-03

决策树是一种广泛应用的监督学习算法，主要用于分类和回归问题。它通过构建一棵树状模型来模拟决策过程，其中每个内部节点代表一个特征或属性测试，每个分支代表一个测试输出，而叶节点则代表最终的决策或类别。在...

第5章 决策树.zip

02-06

在提供的"第5章 决策树.pptx"文件中，可能会详细讲解决策树的理论基础、算法实现、实例分析以及如何在Python的scikit-learn库中使用决策树。通过学习这一章的内容，你将更深入地理解决策树的工作机制，并能熟练运用...

李航老师《统计学习方法》第2版课件：第5章 决策树.rar

热门推荐

Datawhale

09-30

5万+

上个月扫读完《阿里云天池大赛赛题解析》[1]后，看到书中对特征选择的讲述，于是便打算借此机会，系统梳理下各种特征选择方法。如有不足，还望指正。一、背景介绍在处理结构型数据时，特征工程中的特...

决策树介绍及常用算法

wwxsoft的专栏

07-05

3845

决策树、常用算法、剪枝

特征选择方法汇总

每天净瞎搞

10-24

4046

这篇博客汇总了目前的流行的各种特征选择方法

利用决策树找出最优特征组合

zkkkkkkkkkkkkk的博客

08-02

1529

利用决策树进行特征组合，决策树的可视化。

机器学习算法（二十四）：启发式算法优化机器学习算法

全栈川川

08-18

1429

启发式算法优化机器学习算法完整

4.5为什么使用信息增益比来选择特征？

qq_20806657的博客

10-08

5376

这篇文章来源于本人的知乎回答作者：陈彪链接：https://www.zhihu.com/question/22928442/answer/117189907 来源：知乎著作权归作者所有，转载请联系作者获得授权。最近正好在学决策树，信息增益和信息增益率确实是初学阶段很纠结的问题。要解决题主的疑惑，必须先分析Info-Gain(信息增益)和Gain-ratio(信息增益率)的

2021-04-22

qq_53174708的博客

04-22

1441

决策树 1.基础知识： 决策树理解起来是很浅显易懂的一种分类算法，它从数据集中提取出一系列的规则。每一条达到叶节点的路径都是一条规则，用于决策所属类别。将特征作为树的非叶节点；分支是对应特征的每类属性值（已给每条数据都有属性值以及类别）；叶节点是所属类别。如图：熵的计算：那么怎么选择具有决定性的特征呢？为了找到决定性特征，划分出最好的结果，我们必须评估每个特征。熵定义为信息的期望值，先看看信息的计算。如果 xi 类别被划分在含有x1，x2…xn 类的集合中（混合类）， xi 的信息定义为如下：

决策树（Decision Tree）原理小结

小白的专栏

11-20

1583

决策树（Decision Tree）原理小结1. 决策树1.1 决策树基础概念1.2 决策树的学习1.3 决策树学习的3个步骤2. ID3算法2.1 特征选择准则：信息增益2.2 决策树生成算法2.3 决策树剪枝算法3. C4.5算法3.1 特征选择准则：信息增益比3.2 决策树生成算法3.3 决策树剪枝算法4. CART算法4.1 特征选择准则：基尼系数4.2 决策树生成算法4.3 决策树剪枝算法5. 决策树延伸6. 参考 1. 决策树 1.1 决策树基础概念 1.2 决策树的学习 1.3 决策树学习的3

特征选择常用算法综述

weixin_34007906的博客

05-03

4078

1 综述 (1) 什么是特征选择 特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ，或属性选择( Attribute Selection ) ，是指从全部特征中选取一个特征子集，使构造出来的模型更好。 (2) 为什么要做特征选择 在机器学习的实际应用中，特征数量往往较多，其中...

决策树详解：统计学习方法笔记第五章

在本篇读书笔记中，我们深入探讨了《统计学习方法》（李航）第二版中的决策树这一核心概念。决策树作为一种基础的分类与回归工具，以其直观性和高效性在数据分析中占据重要地位。它通过if-then规则集合和条件概率...

第5章 决策树

第5章决策树