西瓜书知识总结（第四章）

最新推荐文章于 2024-07-20 14:10:54 发布

calm-one

最新推荐文章于 2024-07-20 14:10:54 发布

阅读量985

点赞数

分类专栏：机器学习文章标签：决策树机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44605171/article/details/122609984

版权

机器学习专栏收录该内容

13 篇文章 1 订阅

订阅专栏

决策树系列

之前啃西瓜书，发现理论太深，因此换了个角度作知识总结。
决策树是什么？
决策树是采用树形结构用于推理判断最后实现分类的算法。
信息熵是什么？
信息熵是度量样本集合纯度最常见的一种指标， $Ent(D)=-\sum_{k=1}^{|y|}p_k\log_2{p_k}$ 即样本D的信息熵， $p_k$ 是样本所占比例，结论是：信息熵值越小，纯度越高
基尼指数是什么？
基尼指数反映了从数据集D中随机抽取两个样本，器类别标志不一致的概率，其值越小，数据集D的纯度越高
为什么要有剪枝处理？
因为为了为了防止模型过拟合(即学的太好了)，因此对于训练好的树模型需要剪枝处理，一般分为”预剪枝“和”后剪枝“，顾名思义，就是剪枝的顺序问题。”预剪枝“即决策树生成过程中，去除那些不可提升泛化能力的节点直接标记为叶节点，就是不再向下细分。”后剪枝“即树生成过后，自底向上对非叶节点进行考察，进一步处理。
多变量决策树
多变量决策树就是判断的标准不在是单一属性，是属性的线性组合构成，最一般的单变量决策树中判断的标准就是单一属性。
先进行简单理解与记录，后面补上实践部分~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
西瓜书知识总结（第四章）

决策树系列之前啃西瓜书，发现理论太深，因此换了个角度作知识总结。决策树是什么？决策树是采用树形结构用于推理判断最后实现分类的算法。信息熵是什么？信息熵是度量样本集合纯度最常见的一种指标，Ent(D)=−∑k=1∣y∣pklog⁡2pkEnt(D)=-\sum_{k=1}^{|y|}p_k\log_2{p_k}Ent(D)=−∑k=1∣y∣pklog2pk 即样本D的信息熵，pkp_kpk是样本所占比例，结论是：信息熵值越小，纯度越高基尼指数是什么？基尼指数反映了从数据集D中随机抽取两
复制链接

扫一扫

专栏目录

calm-one CSDN认证博客专家 CSDN认证企业博客

码龄6年

23: 原创

54万+: 周排名

55万+: 总排名

4万+: 访问

: 等级

259: 积分

11: 粉丝

19: 获赞

11: 评论

290: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文解读】持续学习三种情形
普通网友: 请问网络结构具体是咋样的
【论文精读】基于骨架行为识别（一）—STGCN
mjc4777: 骨架动作行为识别可以看作是个分类模型，那我想知道分类模型在训练时需要将各类数据随机排序进行训练，那在这一步中关于动作的时间序列是如何处理的？或者每一个动作是一段时间内的连续多帧，那么在卷积时如何做到对每个动作内部的时间帧进行卷积而不是在每个动作的之间进行时间卷积呢？
【论文精读】一类分类器（一）—DSVDD
MrRDuan: 博主有试过将相关的网络结构根据自己的数据集修改么？预处理的自动编码器修改后发现很难拟合
【论文解读】持续学习三种情形
calm-one: 学习的重点不一样，可以看一下元学习的本质
【论文解读】持续学习三种情形
蜡笔新小: 博主你好，自己刚接触学习方法这一块，想要问一下博主，持续学习和元学习的最大区别在哪呢？是他们所放的重点不同么？我理解持续学习是防止灾难性遗忘，元学习是在新的任务上work

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。