随机森林概述

最新推荐文章于 2023-07-11 16:36:57 发布

功夫大笨鲨

最新推荐文章于 2023-07-11 16:36:57 发布

阅读量131

点赞数

分类专栏：随机森林学习笔记文章标签： sklearn 机器学习算法

原文链接：https://blog.csdn.net/qq_45797116/article/details/113763093

版权

随机森林学习笔记专栏收录该内容

7 篇文章 1 订阅

订阅专栏

文章目录

前言
集成算法
- 1. 集成算法概述
- 2.sklearn中的集成算法
总结

前言

在决策树的基础上来学习随机森林

集成算法

1. 集成算法概述

集成学习（ensemble learning）是时下非常流行的机器学习算法，它本身不是一个单独的机器学习算法，而是通过在数据上构建多个模型，集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影，在现实中集成学习也有相当大的作用，它可以用来做市场营销模拟的建模，统计客户来源，保留和流失，也可用来预测疾病的风险和病患者的易感性。在现在的各种算法竞赛中，随机森林，梯度提升树（GBDT），Xgboost等集成算法的身影也随处可见，可见其效果之好，应用之广。

集成算法的目标
集成算法会考虑多个评估器的建模结果，汇总之后得到一个综合的结果，以此来获取比单个模型更好的回归或分类表现。

多个模型集成成为的模型叫做集成评估器（ensemble estimator），组成集成评估器的每个模型都叫做基评估器（base estimator）。通常来说，有三类集成算法：装袋法（Bagging），提升法（Boosting）和stacking。stacking不常用

在这里插入图片描述

装袋法：
构建多个相互独立的评估器，然后对其预测进行平均或多数表决原则来决定集成评估器的结
果。装袋法的代表模型就是随机森林
提升法：
基评估器是相关的，是按顺序一一构建的。其核心思想是结合弱评估器的力量一次次对难以评估的样本进行预测，从而构成一个强评估器。提升法的代表模型有Adaboost和梯度提升树

2.sklearn中的集成算法

sklearn中的集成算法模块ensemble

类	类的功能
ensemble.AdaBoostClassifier	AdaBoost分类
ensemble.AdaBoostRegressor	Adaboost回归
ensemble.BaggingClassifier	装袋分类器
ensemble.BaggingRegressor	装袋回归器
ensemble.ExtraTreesClassifier	Extra-trees分类（超树，极端随机树）
ensemble.ExtraTreesRegressor	Extra-trees回归
ensemble.GradientBoostingClassifier	梯度提升分类
ensemble.GradientBoostingRegressor	梯度提升回归
ensemble.IsolationForest	隔离森林
ensemble.RandomForestClassifier	随机森林分类
ensemble.RandomForestRegressor	随机森林回归
ensemble.RandomTreesEmbedding	完全随机树的集成
ensemble.VotingClassifier	用于不合适估算器的软投票/多数规则分类器

总结

集成算法中，有一半以上都是树的集成模型，可以想见决策树在集成中必定是有很好的效果。

随机森林分类模型
随机森林回归模型

功夫大笨鲨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
随机森林概述

文章目录前言集成算法1. 集成算法概述2.sklearn中的集成算法总结前言在决策树的基础上来学习随机森林集成算法1. 集成算法概述集成学习（ensemble learning）是时下非常流行的机器学习算法，它本身不是一个单独的机器学习算法，而是通过在数据上构建多个模型，集成所有模型的建模结果。基本上所有的机器学习领域都可以看到集成学习的身影，在现实中集成学习也有相当大的作用，它可以用来做市场营销模拟的建模，统计客户来源，保留和流失，也可用来预测疾病的风险和病患者的易感性。在现在的各种算法竞.
复制链接

扫一扫

专栏目录