【机器学习笔记五】决策树

最新推荐文章于 2024-04-21 11:14:55 发布

Daniel Muei

最新推荐文章于 2024-04-21 11:14:55 发布

阅读量161

点赞数

分类专栏： ------机器学习------

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51495585/article/details/116402978

版权

------机器学习------ 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、决策树模型&学习

1）决策树的定义：是一种基本的分类与回归方法。

2）决策树的学习分三个步骤：特征选择、决策树的生成、决策树的修剪。

3）决策树能表示给定特征条件下的条件概率分布。

4）决策树学习本质上是从训练数据集中归纳出一组分类规则。

5）决策树学习根据损失函数最小化建立模型，损失函数通常是正则化的极大似然函数，决策树学习的策略是以损失函数为目标函数的最小化。

二、特征选择

1）特征选择（划分选择）是为了使结点纯度更高。

2）特征选择的准则是信息增益或信息增益比。

3）信息增益：（ID3算法）
①定义：表示由于特征A使得对数据集D进行分类的不确定性减少的程度。

②公式：g(D,A)=H(D)-H(D|A)

③含义：值越大，样本集合用属性A来进行划分所获得的“纯度提升”越大，信息增益大的特征具有更强的分类能力。

信息增益率→C4.5算法
基尼指数→CART算法

信息增益和增益率越大越好，基尼指数越小越好。

4）ID3算法的核心是在决策树各个结点上应用信息增益准则选择特征，递归地构建决策树

三、决策树的剪枝

1）在决策树学习中将已生成的树进行简化的过程称为剪枝，通过极小化决策树整体的损失函数或代价函数来实现。

2）分类：预剪枝、后剪枝
在这里插入图片描述
两者对比：

四、随机森林

定义：随机森林就是通过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树，而它的本质属于集成学习方法。
在这里插入图片描述

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【机器学习笔记五】决策树

一、决策树模型&学习（1）决策树的定义：是一种基本的分类与回归方法。（2）决策树的学习分三个步骤：特征选择、决策树的生成、决策树的修剪。（3）决策树能表示给定特征条件下的条件概率分布。（4）决策树学习本质上是从训练数据集中归纳出一组分类规则。（5）决策树学习根据损失函数最小化建立模型，损失函数通常是正则化的极大似然函数，决策树学习的策略是以损失函数为目标函数的最小化。二、特征选择（1）特征选择（划分选择）是为了使结点纯度更高。（2）特征选择的准则是信息增益或信息增益比。（3）信息增
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。