决策树及其拓展吴恩达课程

最新推荐文章于 2024-07-26 14:07:59 发布

卷心菜不想卷

最新推荐文章于 2024-07-26 14:07:59 发布

阅读量523

点赞数 17

分类专栏：吴恩达 DeepLearning.AI 文章标签：决策树算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52775136/article/details/138574392

版权

吴恩达 DeepLearning.AI 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

看到了个关于决策树很好的文章：链接

决策树

在所有可能的决策树中，选择一个在训练集上表现良好，并能很好的推广到新数据（即交叉验证集和测试集）的决策树。
参考文章
在这里插入图片描述

熵

在这里插入图片描述

信息增益

信息增益越大，表示该特征对数据集划分所获得的“纯度提升”越大。所以信息增益可以用于决策树划分属性的选择，即选择信息增益最大的属性。
在这里插入图片描述

关于信息增益的另一篇参考文章

构建决策树的过程

计算所有可能的信息增益，并选择最高的信息增益，根据选择的特征拆分数据集，并创建左右节点。继续递归调用以上拆分过程，直到达到阈值标准为止：
1.当某个节点的纯度为100%，即该节点的所有样本都属于一个类
2.当拆分节点后，导致树的深度超过最大深度
3.当拆分节点后，信息增益小于阈值时
4.当节点中的样本个数小于阈值时

另一篇详细讲解构建决策树的文章

独热编码

独热编码用来解决类别型数据的离散值问题

优：独热编码解决了分类器不好处理属性数据的问题，在一定程度上也起到了扩充特征的作用。它的值只有0和1，不同的类型存储在垂直的空间。
缺：当类别的数量很多时，特征空间会变得非常大。在这种情况下，一般可以用PCA来减少维度。而且one hot encoding+PCA这种组合在实际中也非常有用。
独热编码详细解说

连续值处理

吴恩达讲解视频里是设定阈值。
在这里插入图片描述

另一篇文章不一样的方法：离散化策略——二分法

决策树不仅可以用来分类，也可以用于回归问题（连续的值）：

参考文章
 分类树与回归树的区别
在这里插入图片描述
从根节点开始，一步一步划分，直到到达叶子节点，最后输出预测特征值

决策树集合

单个决策树可能会对数据的微小变化高度敏感，即鲁棒性（意思稳定性差）很差。所以使用多个决策树。
在这里插入图片描述
对每个决策树分别进行预测，最后统计结果，选择多数的结果作为最终预测结果。
参考文章

卷心菜不想卷

关注

17
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
决策树及其拓展吴恩达课程

计算所有可能的信息增益，并选择最高的信息增益，根据选择的特征拆分数据集，并创建左右节点。在所有可能的决策树中，选择一个在训练集上表现良好，并能很好的推广到新数据（即交叉验证集和测试集）的决策树。单个决策树可能会对数据的微小变化高度敏感，即鲁棒性（意思稳定性差）很差。对每个决策树分别进行预测，最后统计结果，选择多数的结果作为最终预测结果。从根节点开始，一步一步划分，直到到达叶子节点，最后输出预测特征值。1.当某个节点的纯度为100%，即该节点的所有样本都属于一个类。3.当拆分节点后，信息增益小于阈值时。
复制链接

扫一扫

专栏目录

卷心菜不想卷 CSDN认证博客专家 CSDN认证企业博客

码龄4年

53: 原创

1万+: 周排名

3万+: 总排名

2万+: 访问

: 等级

804: 积分

233: 粉丝

263: 获赞

4: 评论

207: 收藏

私信

关注

热门文章

分类专栏

吴恩达 DeepLearning.AI 9篇

最新评论

GloVe: Global Vectors for Word Representation论文笔记解读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Distributed Representations of Words and Phrases and their Compositionality论文笔记解读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Efficient Estimation of Word Representations in Vector Space论文笔记解读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
线性回归与多元线性回归吴恩达
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
实验4-1-4 找出最小值用while写
ws576686: 请问一下最后printf里面min跟%d与等号之间为啥要有空格

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。