StatQuest系列之Random Forests

最新推荐文章于 2021-02-23 16:04:51 发布

仙女修炼史

最新推荐文章于 2021-02-23 16:04:51 发布

阅读量280

点赞数 1

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45209433/article/details/113921143

版权

随机森林决策树自举数据集特征选择分类

关键词由CSDN通过智能技术生成

机器学习算法专栏收录该内容

8 篇文章 1 订阅

订阅专栏

以下内容来自b站的StatQuest视频，感兴趣的可以直接去看原视频，讲的很好，复杂问题简单化，大大的推！
下面将从一个简单的例子说明RandomForest机制

Step 1、构建自举数据集，bootstrapped dataset

从原始数据集的M个样本中，随机选择N个样本，N < M，并且N个样本中可以重复，也就是有放回的从M个样本中随机选取N个样本，完成一次这样的取样，就得到了一个bootstrapped 数据集。
下面的例子中，从4个样本的数据集随机选择4个可重复的样本。
在这里插入图片描述

Step 2、使用bootstrapped dataset创建决策树

我们使用step1 获得的bootstrapped dataset来创建决策树，但是我们不使用数据集全部的特征维数R（该例子中，数据集的特征维数，也叫变量个数为4），而是随机选择r个特征，r < R。
在该例子中，随机选择两个特征，即Good Blood Circulation和Block Arteries，假设Good Blood Circulation 样本区分能力比较强，因此作为该决策树的root，那么其左叶子节点将在剩下的3个特征中随机选择2两个，我们按照决策树的方式完成该tree的建立，只是每一步都在剩下的特征中随机选择特征。
在这里插入图片描述
每个决策树的建立都是基于随机样本，决策树的每个节点都是基于随机特征，这两个随机可以生成很多不同的决策树，这些决策树组成了灵活的，功能强大的随机森林。

Step3、随机森林如何使用

由上面我们知道，随机森林包含了很多不同的决策树，在分类时，将待分类样本扔入算法中，每个决策树给出自己的结果，统计所有决策树的结果，最后投票给出最终分类结果。

在这里插入图片描述

仙女修炼史

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。