随机森林 java_谈谈模型融合之二 —— 随机森林

最新推荐文章于 2024-08-01 02:04:27 发布

weixin_39928102

最新推荐文章于 2024-08-01 02:04:27 发布

阅读量272

点赞数 1

文章标签：随机森林 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39928102/article/details/114460672

版权

本文介绍了随机森林算法的思想，包括自助采样、Bagging原理以及随机森林的特点。通过投票法策略展示了随机森林的Java代码实现，并对比了不同集成策略。文章适合初学者了解和学习随机森林。

摘要由CSDN通过智能技术生成

前言

上篇文章介绍了集成学习的相关概念以及基于 Boosting的 AdaBoost，这篇文章将介绍基于模型融合的另一种方式 Bagging 的算法，随机森林(Random Forest)。(上篇公式敲的太累了这篇就来个简单的缓解缓解)

随机森林

算法思想

我们先来看看这个算法的名字，可以拆分开为两部分，随机和森林。森林我们很容易可以想到，就是有很多棵树，即由多颗决策树组成。那么随机指的是什么呢？这里我们来看看 Bagging 的思想了。

首先先说说自助采样(Bootstrap Sanpling)

指任何一种有放回的均匀抽样，也就是说，每当选中一个样本，它等可能地被再次选中并被再次添加到训练集中。

而 Bagging 则是利用自助采样得到 T 组训练样本集，分别利用这些训练样本集训练 T 个分类器，最后进行集成的方法。从 Bias-Variance 分解的角度看， Bagging 主要关注降低方差。

那么，我们大概就能知道这个随机大概是什么意思了，就是随机抽取训练集。

那么，问题又来了，到底是随机抽取一定量的样本呢还是抽取部分特征呢？答案是都有，随机在这两方面都有所体现。

所以可以列出这么一个等式—— Random Forest = Bagging + Fully-Grown CART with Random Subspace。

其特点为：

可高度并行化

继承了 CART 的优点

克服了完全生长树的缺点

融合策略

知道了随机森林的算法思想后，知道了最后是需要将所有决策树的预测结果进行集成，那我们采

最低0.47元/天解锁文章

weixin_39928102

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。