python学习总结7.22

最新推荐文章于 2022-06-28 15:31:52 发布

沐美樱子

最新推荐文章于 2022-06-28 15:31:52 发布

阅读量150

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45817425/article/details/107520591

版权

**

集成算法与随机森林

**

01集成算法-随机森林

Bagging模型

全称：bootstrap aggregation
最典型的代表就是随机森林
随机：数据采样随机，特征选择随机
森林：很多个决策树并行放在一起

02特征重要性衡量

随机森林优势

能够处理很高维度（feature很多）的数据，并且不用做特征选择
在训练完后，它能够给出哪些feature比较重要
容易做成并行化方法，速度比较快
可以进行可视化展示，便于分析

03提升模型

Ensemble learning

目的：让机器学习效果更好
Bagging：训练多个分类取平均
Boosting：从弱学习器开始加强，通过加权来进行训练
Stacking：聚合多个分类或回归模型（可以分阶段来做）
Boosting模型
典型模型：AdaBoost，Xgboost
Adaboost会根据前一次的分类效果调整数据权重
解释：如果某一个数据在这次分错了，那么在下一次我就会给它更大的权重
最终的结果：每个分类器根据自身的准确性来确定各自的权重，再合体

04堆叠模型

Stacking模型

堆叠：
可以堆叠各种各样的分类器（KNN、SVM、RF等等）
分阶段：第一阶段得出各自结果，第二阶段再用前一阶段结果训练

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python学习总结7.22

**集成算法与随机森林**01集成算法-随机森林Bagging模型全称：bootstrap aggregation最典型的代表就是随机森林随机：数据采样随机，特征选择随机森林：很多个决策树并行放在一起02特征重要性衡量随机森林优势能够处理很高维度（feature很多）的数据，并且不用做特征选择在训练完后，它能够给出哪些feature比较重要容易做成并行化方法，速度比较快可以进行可视化展示，便于分析03提升模型Ensemble learning目的：让机器学习效果更
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。