集成算法与随机森林简介

最新推荐文章于 2022-09-17 22:04:42 发布

饮马长城窟

最新推荐文章于 2022-09-17 22:04:42 发布

阅读量363

点赞数

分类专栏： scikit

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/junshan2009/article/details/103411454

版权

scikit 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

集成算法的种类：

第一种，随机森林模型

随机森林的优势：

①能够处理很高维度的数据，不用做特征选择。

②训练完之后可以给出哪些feature比较重要

③容易做成并行化方法，速度较快

④可视化展示。

第二种： Boosting模型。串行模式

从弱学习期开始加强，通过加权来进行训练。

典型代表：AdaBoost ,Xgboost

Ada boost会根据前一次的分类效果调整数据权重。

如果某一个数据在这次分类分错了，那么下次就会获得更大的权重。

最终的结果，每个分类器根据自身的准确性来确定各自的权重。

Xgboost 是一个非常强大的集成算法，各大比赛获得好成绩的基本都用这个。（后续单独写一篇文章）

第三种： Stacking算法

拿来一堆分类器，为了刷结果，全部都用上。

第一步，使用不同的分类器得到结果。第二步，训练分类器的结果。

集成算法实战： ml-ensemble.com

from mlens.ensemble import SuperLearner

饮马长城窟

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
集成算法与随机森林简介

集成算法的种类：第一种，随机森林模型随机森林的优势：①能够处理很高维度的数据，不用做特征选择。②训练完之后可以给出哪些feature比较重要③容易做成并行化方法，速度较快④可视化展示。第二种： Boosting模型。串行模式从弱学习期开始加强，通过加权来进行训练。典型代表：AdaBoost ,XgboostAda boost会根据前一次的分...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。