Sklearn中的随机森林

最新推荐文章于 2023-07-20 13:00:12 发布

「已注销」

最新推荐文章于 2023-07-20 13:00:12 发布

阅读量8.8k

点赞数 2

分类专栏：随机森林

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ff19910203/article/details/49129137

版权

Sklearn是python的机器学习算法的包，在整个机器学习过程中具有非常好的口碑。我把最近看的一些东西加上自己做实验的理解做了一份总结。

1. 随机森林介绍

随机森林是一种统计学习理论，其随机有两个方面：首先在训练的每一轮中，都是对原始样本集有放回的抽取固定数目的样本点，形成k 个互不相同的样本集。第二个点是：对于每一个决策树的建立是从总的属性中随机抽取一定量的属性作为分裂属性集，这样对于k个树分类器均是不相同的。由随机生成的k个决策树组成了随机森林。

对于每一个决策树来说，其分裂属性是不断地选取具有最大信息增益的属性进行排列。整个随机森林建立后，最终的分类标准采用投票机制得到可能性最高的结果。

2. 随机森林随机选择子集需要注意

a) 如果一共有K个特征，每次取其平方根数量即可

b) 设每棵树的深度为n，那么共有2^n个叶子节点，那么所需要的样本点按照经验来看，2^n * 1000的效果最好。至于选取多少特征，大概就是低于样本数量的千分之一，2∧树深＊1000＝样本数量。如果不超过1000的样本，怎么做效果没有多大区别，所以研究提取的特征意义不大。

3. 随机森林自我测试

有的资料上显示，随机森林使用63%的数据作为训练数据集，37%的数据作为测试数据，但是并没有什么科学依据。就是交叉验证就可以。

4. 随机森林用途

a) 很好的用于分类和回归问题

b) 离群点分析和异常检测

c) 显示的缺失数据的计算

5. 多种模型融合技术对比</

最低0.47元/天解锁文章

「已注销」

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
3
评论
Sklearn中的随机森林

Sklearn是python的机器学习算法的包，在整个机器学习过程中具有非常好的口碑。我把最近看的一些东西加上自己做实验的理解做了一份总结。1. 随机森林介绍随机森林是一种统计学习理论，其随机有两个方面：首先在训练的每一轮中，都是对原始样本集有放回的抽取固定数目的样本点，形成k 个互不相同的样本集。第二个点是：对于每一个决策树的建立是从总的属性中随机抽取一定量的属性作为分裂属性集
复制链接

扫一扫

专栏目录

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄13年

17: 原创

-: 周排名

-: 总排名

5万+: 访问

: 等级

715: 积分

7: 粉丝

14: 获赞

6: 评论

47: 收藏

私信

关注

热门文章

分类专栏

最新评论

神经网络neural networks+决策树decision tree 组合算法
ShieldVictory: 值得学习，谢谢分享！
神经网络neural networks+决策树decision tree 组合算法
froglzh: 阅读和总结论文的方法不错，值得学习
Sklearn中的随机森林
NoTime4Emotion 回复 letter1225: 麻烦询问下有这个的数学公式推导吗？
Sklearn中的随机森林
letter1225: 很细心，sklearn中随机森林的集成方法确实不是基于投票，而是采用各决策树的预测值取平均。In contrast to the original publication [B2001], the scikit-learn implementation combines classifiers by averaging their probabilistic prediction, instead of letting each classifier vote for a single class.这是官方文档中的原话。见http://scikit-learn.org/stable/modules/ensemble.html 中的1.11.2.1
计算机视觉：随机森林算法在人体识别中的应用
一只小学生: 可是文章中的图看不了[难过脸]

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。