应用机器学习（七）：随机森林

最新推荐文章于 2024-07-29 21:22:31 发布

Goodsta

最新推荐文章于 2024-07-29 21:22:31 发布

阅读量1.6k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wong2016/article/details/72801836

版权

随机森林是一种集成学习方法，通过构建多棵决策树并取众数作为分类结果，以减少过拟合。文章介绍了随机森林的基本原理，包括决策树的过拟合问题、Bootstrapping过程、特征装袋以及随机森林的性质，如袋外误差和变量重要性。还提供了R语言的执行代码示例。

摘要由CSDN通过智能技术生成

随机森林

随机森林( Random forest )，是一种用于分类、回归等任务的集成学习方法。对于分类任务，它在训练时构建多棵决策树，输出这些树的分类结果的众数( mode )，即，将大多数树的分类结果作为最终的结果。这样，随机森林修正了单棵决策树过度拟合训练集的倾向。

随机森林算法

准备工作：决策树学习

对于详细的决策树学习理论，请参考 应用机器学习 | 第七讲。

在构建的决策树里，长的比较”深”的树，倾向过拟合训练集，即，它有较低的偏差，但较高的方差。随机森林平衡了多棵决策树，目的是减小预测方差，但付出的代价是，增加了偏差且损失了部分模型可解释性。尽管如此，随机森林仍然很大程度上改善了最终模型的预测表现。

Tree bagging

给定一个训练集 $\mathbf{X}=(x_1, x_2, \dots, x_n)$ , 响应变量(类标签) $Y=(y_1, y_2, \dots, y_n)$ .
所谓装袋( bagging )，指的是从训练集中有放回地抽取一个随机样本，在这个样本上拟合树。假设重复装袋 $B$ 次，整个训练过程为：

对

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。