随机森林小结

最新推荐文章于 2021-05-19 12:04:29 发布

荔枝童鞋

最新推荐文章于 2021-05-19 12:04:29 发布

阅读量1.6w

点赞数 2

分类专栏：机器学习文章标签：随机森林分类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liz_zhong/article/details/50005911

版权

机器学习中，随机森林是一种组合方法，由许多的决策树组成，因为这些决策树的形成采用了随机的方法，因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测试数据进入随机森林时，其实就是让每一颗决策树进行分类，最后取所有决策树中分类结果最多的那类为最终的结果。因此随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。

随机森林由决策树组成，决策树实际上是将空间用超平面进行划分的一种方法，每次分割的时候，都将当前的空间一分为二，使得每一个叶子节点都是在空间中的一个不相交的区域，在进行决策的时候，会根据输入样本每一维feature的值，计算信息增益，或者Gini值，一步一步往下分裂，最后使得样本落入N个区域中的一个(假设有N个叶子节点，对于二元分类，N=2)。

随机森林可以既可以处理属性为离散值的量，比如ID3算法，也可以处理属性为连续值的量，比如C4.5算法。(Q：sklearn模块中调用的RandomForestClassifier需要对连续属性离散化，如何处理连续属性???)

随机森林的优点：

1.适合做多分类问题；当存在分类不平衡的情况时，随机森林能够提供平衡数据集误差的有效方法(通过属性评估?)；

2.训练和预测速度快；

3.对训练数据的容错能力，是一种有效估计missing值的方法，当数据集中有大比例的数据缺失时仍然可以保持精度不变；

4.能够有效地处理大的数据集；

5.它能够处理很高维度(feature很多)的数据，并且不用做特征选择

6.能够在分类的过程中可以生成一个泛化误差的内部无偏估计(OOB error可以作为泛化误差的一个估计)；

7.能够检测到特征之间的相互影响以及重要性程度(通过feature_importances_方法)；

8.不容易出现过度拟合；实现简单容易并行化(通过n_jobs)。

9.模型的上述性能可以被扩展运用到未标记的数据集中，用于引导无监督聚类、数据透视和异常检测(如何实现???)；

随机森林的缺点：

最低0.47元/天解锁文章

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
4
评论
随机森林小结

机器学习中，随机森林是一种组合方法，由许多的决策树组成，因为这些决策树的形成采用了随机的方法，因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测试数据进入随机森林时，其实就是让每一颗决策树进行分类，最后取所有决策树中分类结果最多的那类为最终的结果。因此随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。随机森林由决策树组成，决策树实际上是将空间用超平面
复制链接

扫一扫

专栏目录

荔枝童鞋 CSDN认证博客专家 CSDN认证企业博客

码龄9年

18: 原创

31万+: 周排名

35万+: 总排名

6万+: 访问

: 等级

767: 积分

22: 粉丝

22: 获赞

5: 评论

23: 收藏

私信

关注

热门文章

分类专栏

最新评论

随机森林小结
我只是一个搬砖的回复 SpongeBob_yaya: 越低越好吧，袋外误差
决策树原理-python实现
hi-ha-hi: 写得很清楚了
随机森林小结
SpongeBob_yaya: 你好，我想问下.oob_score的值是越大越好吗
随机森林小结
pgplayer_upc: 作者你好我用的随机森林matlab工具包，请问袋外数据预测的函数在哪里看，袋外数据预测结果，即获得P（预测值为1[表情]真实值为1），P（预测值为2[表情]真实值为1），P（预测值为,3[表情]真实值为1）（假设有3个类）。怎么弄啊不知道在哪里修改输出？谢谢啦！
随机森林小结
一个处女座的程序媛: 随机森林是一种组合方法，由许多的决策树组成，因为这些决策树的形成采用了随机的方法，因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测试数据进入随机森林时，其实就是让每一颗决策树进行分类，最后取所有决策树中分类结果最多的那类为最终的结果。

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。