机器学习之随机森林（一）

最新推荐文章于 2024-04-28 21:37:12 发布

繁华三千东流水

最新推荐文章于 2024-04-28 21:37:12 发布

阅读量2.8k

点赞数

分类专栏：机器学习算法思想及代码实现文章标签：机器学习随机森林

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq872890060/article/details/99703676

版权

集成学习模型一览

在这里插入图片描述

随机森林

走进森林，参天大树一棵棵相继出现
在这里插入图片描述

概念介绍

随机森林是基于决策树的集成学习模型，如果将一颗决策树比作一个决策者，那么随机森林就是一群决策者共同决定一件事情，所以相比于决策树等单个学习器的模型，随机森立的准确度和泛化能力往往更好和更高。
随机森林是多个学习器并行计算的算法模型，通过一定的结合策略，将这些弱学习器有机组合起来，形成一个强的学习器。
优点

机器学习中最成功的算法之一
可以做二分类，多分类，回归等学习任务
不需要特征缩放
可以捕获非线性关系
算法可以并行

随机森林的随机

随机森林的随机体现在样本随机和特征随机。

样本随机的目的是，增大样本的随机性，进而减少了模型的相似性，那么就降低了模型的相关性，也就是说提高了整体模型的健壮性，统一地说就是为了增加模型的泛化能力。
特征随机的目的是，不使用所有特征，可以更简单地划分平面，增强模型的可解释性，缩短了模型的训练时间，移除不重要的特征，达到降维效果的同时，去除选择不好特征的可能性。
样本随机产生的方法是：bootstrapping（拔靴法），有放回抽样。
特征随机产生的方法是：
简单法：随机从原始特征中抽取不重复的特征
复杂法：随机从原始特征中抽取不重复分特征，再将这些特征合并，产生新的特征。

特征选择的思考

如果可以计算出每个特征的重要性，即 importance(k) for k = 1, 2, … ,d。那就能将不重要的特征舍弃，达到降维的效果

置换检验

介绍：置换检验是统计学中显著性检测的一种
思想：如果特征k是重要的，那么用随机的值将该特征破坏&#

最低0.47元/天解锁文章

繁华三千东流水

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
机器学习之随机森林（一）

RF是基于决策树的集成模型，随机森林是机器学习中最成功的算法之一，他能做二分类、多分类和回归任务。随机森林里集成了很多棵决策树，目的是减小过拟合的风险（减小模型方差）。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。