决策树随机森林

狗狗人

已于 2023-03-16 14:23:03 修改

阅读量69

点赞数 1

分类专栏：遗产文章标签：决策树随机森林

于 2023-02-17 14:26:44 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dogman_/article/details/122277658

版权

遗产专栏收录该内容

27 篇文章 1 订阅

订阅专栏

文章介绍了决策树的基本原理，特别是ID3算法，该算法基于信息增益来选择最优属性，构建决策树。信息增益是衡量属性选择后不确定性减少的程度。此外，文章还提及了随机森林，这是一种通过多棵决策树并结合它们的结果来做出预测的集成学习方法。

摘要由CSDN通过智能技术生成

DECISION TREE

ID3

对于一棵决策树，如何使用是非常简单的，在此不过多赘述

其实大多数模型都是一个思路：
通过数据进行训练，构建模型，之后对于一个新数据，只需代入模型即可

问题是如何构建模型，这才是一个算法的关键

构建方法有很多种，在此我们仅介绍ID3（考试只考这个）

ID3

总的来说，ID3就是一种按照不同属性的信息增益来递归构造决策树的方法

将所有属性的信息增益都计算一边之后，取最大的属性为根节点，再对每一个子树进行同样步骤，直到所有叶子节点都只有一个值，或所有属性都使用过

信息增益

$Gain(S,A)=Ent(S)-\sum_{j=1}^m \frac{|S_j|}{|S|}Ent(S_j)$

$信息熵 - 条件熵$

信息增益表示得知属性 a 的信息而使得样本集合不确定度减少的程度

A为属性A，j 为属性A的取值，m为属性A的取值数量， $S_j$ 为属性A取 j 的样本集合
|S|代表样本数量

信息熵

信息熵是度量样本集合不确定度最常用的指标：

$Ent(S)=-\sum p_i Log_{2} (p_i)$

S表示一个集合，含有N个元素，n个离散取值种类， $p_i$ 表示对于其中第 i 种取值，其概率的值（比例）

条件熵

$\sum_{j=1}^m \frac{|S_j|}{|S|}Ent(S_j)$

随机森立

概述

就是n棵决策树，通过这些决策树的结果投票，得出最终结果

构造随机森林中的树：
对于含有N个样本的样本集S，采取bootstrap的方法，取得m个新的样本集，
之后再从K属性中抽取k个属性，以这k个属性为属性集合构造决策树，（k<<K)
生成m课数，形成随机森林

最终决策时要以投票的方式选取最终结果

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

狗狗人 CSDN认证博客专家 CSDN认证企业博客

码龄3年

50: 原创

76万+: 周排名

80万+: 总排名

3万+: 访问

: 等级

495: 积分

7: 粉丝

62: 获赞

5: 评论

68: 收藏

私信

关注

热门文章

分类专栏

最新评论

渲染流水线相关知识总结
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615211161?utmsource=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utmsource=blogger_star_comment。
绒毛/短毛渲染
ssssski: ：直到尖尖
Unity模板缓冲
ssssski: 啊啊啊啊啊啊
Unity模板缓冲
ssssski: 哇哇哇哇
unity边缘检测
ssssski: 哇哦哇哦哇哦

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。