机器学习笔记十四：随机森林

最新推荐文章于 2022-10-24 15:01:11 发布

谢小小XH

最新推荐文章于 2022-10-24 15:01:11 发布

阅读量2k

点赞数

分类专栏：机器学习理论文章标签：机器学习随机森林

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xierhacker/article/details/62046061

版权

随机森林是一种基于集成学习的bagging方法，使用CART决策树作为基本分类器。通过随机采样创建多个决策树，并以投票方式决定最终分类。随机森林在减少过拟合、处理高维数据及并行化方面具有优势，但可能在噪音样本集上过拟合，且对划分多的特征敏感。

摘要由CSDN通过智能技术生成

在上一篇机器学习笔记十三：Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式.
而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,baggin这里就不再讲一遍了,详情见机器学习笔记十三：Ensemble思想(上)

然后你还需要有决策树和CART分类与回归树的基本知识.因为随机森林的基本分类/回归器是CART,(这个后面会提到.)所以只有先理解了CART才能够算能够真正理解了随机森林.
要是对于决策树和CART不熟,转到:
机器学习笔记十一：决策树
 机器学习笔记十二：分类与回归树CART

随机森林相对于Adaboost或者是GBDT等集成学习算法来说,是比较简单易懂的,思想也很自然.要是上面列出的基础知识心里有数之后,就非常容易的理解随机森林了.

一.随机森林算法

先用比较简单的语言描述一下随机森林算法,注意和bagging思路的对比哦.
随机森林在bagging的基础上做了一些修改,大致的算法是:

1.从样本集中随机采样选择n个样本;
2.从所有属性中随机选择k个特征,选择最佳分割特征作为节点建立CART决策树;
3.重复上面两步m次,那么就建立了m棵决策树;
4.这m个CART形成随机森林,通过投票表决,决定数据属于哪一类.

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。