关于集成学习的总结（一）投票法

最新推荐文章于 2024-05-25 08:00:00 发布

PythonstartL

最新推荐文章于 2024-05-25 08:00:00 发布

阅读量1.3w

点赞数 8

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PythonstartL/article/details/83010928

版权

最近在写那个完整的机器学习项目博客时候，我本来打算用一篇博客来写的。结果发现要写的越来越多。而且最关键的是，以前以为有些地方理解了，其实并没有理解。大概这就是写博客记笔记的好处吧。。。可惜我上高中初中那会，从来都没记过233333

这篇集成学习的总结呢，将结合sklearn 的运用说一说有关集成学习的一些东西，包括bagging、boosting、stacking和其他一些算法，我们会重点讨论随机森林、GBDT、Xgboost、LightGBM。也包括sklearn 当中怎么使用它们，sklearn中对这些参数怎么进行调参等。

每一篇打算要最后回答这样几个问题：

该集成学习方法的流程？
该集成学习方法如何选择特征？
该集成学习方法如何构建特征？
该集成学习方法如何用于分类或回归？
该集成学习方法通过什么方式减少误差？
该集成学习方法的效果相比于传统的LR，SVM效果为什么好一些？
该集成学习方法如何加速训练？
该集成学习方法的参数有哪些，如何调参？
该集成学习方法实战当中遇到的一些问题？
该集成学习方法的优缺点？
该集成学习算法与其他集成方法的不同？

。

投票分类

假设你已经训练了一些分类器，每一个都有 80% 的准确率。你可能有了一个逻辑斯蒂回归、或一个 SVM、或一个随机森林，或者一个 KNN，或许还有更多。现在我们可以在这些基学习器的基础上得到一个投票的分类器，把票数最多的类作为我们要预测的类别

最低0.47元/天解锁文章

关注

8
点赞
踩
52

收藏

觉得还不错? 一键收藏
5
评论
关于集成学习的总结（一）投票法

最近在写那个完整的机器学习项目博客时候，我本来打算用一篇博客来写的。结果发现要写的越来越多。而且最关键的是，以前以为有些地方理解了，其实并没有理解。大概这就是写博客记笔记的好处吧。。。可惜我上高中初中那会，从来都没记过233333 这篇集成学习的总结呢，将结合sklearn 的运用说一说有关集成学习的一些东西，包括bagging、boosting、stacking和其他一些算法，我们会重点...
复制链接

扫一扫

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。