未来面试之二：随机森林

最新推荐文章于 2024-06-05 04:00:00 发布

奔跑的栀子

最新推荐文章于 2024-06-05 04:00:00 发布

阅读量3k

点赞数 3

分类专栏：算法文章标签：随机森林模型 R语言面试常用原理萌新

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41020194/article/details/79942316

版权

本文介绍了随机森林的建立过程，包括样本的随机抽取和特征的随机选择，强调了其在决策树基础上的集成学习思想。随机森林由于其并行性和抗过拟合能力，成为一种高效的机器学习算法。在R语言中，randomForest包提供了实现和特征选择功能。文章还区分了分类树和回归树的应用场景。

摘要由CSDN通过智能技术生成

写在前面的话

上一篇博文讲过了决策树啦，正好给这一篇的随机森林做铺垫（讲真，我是想先讲随机森林的，无奈随机森林的基础是决策树，因此只能先决策树知识来一波）。至于我为啥这么稀罕随机森林呢，是因为从进科研室的时候起，我就对随机森林这个名字产生了特殊的兴趣，因为一听这个名字，你会不由得想到一片绿油油的森林。但是，它明明是个模型的嘛。内心很纠结，就小小的学习了下其中的原理，嘿，原理倒不难理解，但是功能却很强大。所以呀，要好好说说它。

决策树与随机森林

前面讲过决策树，而在随机森林这里不用过多的纠结决策树的原理，在这里只要把它想象成两种树好啦，一种是回归树，一种是分类树。

随机森林的建立

那随机森林是怎样建立的呢？它的随机性体现在什么地方呢？

随机森林就是通过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树，而它的本质属于机器学习的一大分支----集成算法。

具体来说，首先看随机森林的建立过程：

1、首先用N来表示原始训练集样本的个数（即样本数量），M来表示变量的数目（变量的个数）

最低0.47元/天解锁文章

奔跑的栀子

关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

奔跑的栀子 CSDN认证博客专家 CSDN认证企业博客

码龄7年

16: 原创

75万+: 周排名

170万+: 总排名

3万+: 访问

: 等级

351: 积分

18: 粉丝

14: 获赞

10: 评论

84: 收藏

私信

关注

分类专栏

MySql 3篇
小项目 2篇
计算广告 2篇
碎碎念 2篇
R笔记 2篇
算法 4篇

最新评论

白酒数据分析
奔跑的栀子: 抱歉，不方便哈~这个是某个公司面试题，也算是公司内部真实数据
白酒数据分析
weixin_38954007: 楼主方不方便提供一下数据源，万分谢谢，1449909431@qq.com
白酒数据分析
半世清欢: 楼主方不方便提供一下数据源，谢谢，625207764@qq.com
hive sql中的“坑”
大家一起学编程（python）: 好文，评论一波走起
hive sql中的“坑”
彼方: 好文，收藏学习了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。