决策树系列之随机森林

最新推荐文章于 2021-10-30 09:52:22 发布

coffeetea01

最新推荐文章于 2021-10-30 09:52:22 发布

阅读量1.3k

点赞数

文章标签：随机森林决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/coffeetea01/article/details/80298781

版权

1、基本概念：Bagging、Booststraping、OOB数据

 
 Booststraping: 
 有放回样本； 

 
 Bagging:  
 全称Boostrapping aggregation 

  步骤： 

  1、从样本集中重采样，选出n个样本；在所有属性上，对这n个样本建立分类器；（分类器可以是决策树（ID3，C4.5,CART）、SVM或Logistic回归等） 

  2、重复步骤1，m次，得到m个分类器； 

  3、将数据放在这m个分类器上，最后根据这m个分类器的投票结果，决定将数据属于哪一类； 

 
 OOB数据：每次Boostraping，约有一定比率的样本不会出现在模型训练部分，可以用于取代测试集，用于误差估计。 

2、什么是随机森林？

 
 步骤如下： 

 
 1、从样本集合中用Boostraping采样选出n个样本； 

 
 2、从所有属性中随机选择k个属性，选择最佳分割属性作为节点，建立CART决策树；（可以是其他分类器） 

 
 3、重复步骤1和2，建立m个基分类器； 

 
 4、由m个CART模型形成随机森林，通过投票表决结果，决定数据属于哪一类； 

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
决策树系列之随机森林

1、基本概念：Bagging、Booststraping、OOB数据2、什么是随机森林？3、随机森林与决策树的关系4、投票机制5、样本不均衡的方法：6、应用：6.1、使用随机森林计算样本间相似度6.2、使用随机森林计算样本重要度7、Isolation Forest8、思考问题...
复制链接

扫一扫

coffeetea01 CSDN认证博客专家 CSDN认证企业博客

码龄8年

15: 原创

114万+: 周排名

89万+: 总排名

4万+: 访问

: 等级

456: 积分

1: 粉丝

2: 获赞

2: 评论

22: 收藏

私信

关注

热门文章

分类专栏

最新评论

决策树系列之提升
qq_42972774: 图片看不到，只有文字
Python 多CPU并行处理数据
张叫张大卫: 我觉得这个是利用了单个CPU的多个核心吧？并不是多个CPU

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。