【集成学习】7 投票法的原理和案例分析

最新推荐文章于 2023-02-28 18:00:59 发布

J_caicaicai

最新推荐文章于 2023-02-28 18:00:59 发布

阅读量246

点赞数

分类专栏：学习笔记文章标签：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/apple_50678962/article/details/115708228

版权

学习笔记专栏收录该内容

27 篇文章 1 订阅

订阅专栏

Voting

投票法的思路

voting – 集成学习常用技巧
可以提高模型的泛化能力，减少模型的错误率。

航空航天领域，每个零件发出的电信号都对航空器的成功发射起到重要作用
二进制信号，不小心传输发生了错误打灭
常用的纠错方法 – 重复多次发送数据，少数服从多数
（hadoop也都很多vote场景

对于regression，投票法最终的预测结果是多个其他回归模型预测结果的平均值
对于classification，
- 硬投票法的预测结果是多个模型预测结果中出现次数最多的类别
- 软投票法对各类预测结果的概率求和，最终选取概率之和最大的标签

投票法的原理分析

少数服从多数原则的集成学习模型
通过多个模型额集成降低方差，从而提高模型robust。
在理想情况下，投票法的预测效果应当由于任何一个基模型的预测效果。

投票法的分类

回归投票法：预测结果=所有模型预测结果的平均值
分类投票法：预测结果=所有模型中出现最多的预测结果
- 分类硬投票：预测结果是所有投票结果最多出现的类
- 分类软投票：预测结果是所有投票结果中概率加和最大的类
  （软投票考虑到了预测概率这一额外信息，因此可以得出比硬投票更加准确的预测结果）

voting产生好的结果，需要满足两个条件

基模型之间的效果不能差别过大
- 当某个基模型相对于其他基模型效果过差时，该模型很可能成为噪声
基模型之间应该有较小的同质性
- 例如在基模型预测效果近似的情况下，基于树模型与线性模型的投票，往往优于两个树模型或两个线性模型。

使用硬投票 or 软投票

当投票集合中使用的模型能预测出清晰的类别标签时，适合使用硬投票。
当投票集合中使用的模型能预测类别的概率时，适合使用软投票。
（软投票同样可以用于那些本身并不预测类成员概率的模型，只要他们可以输出类似于概率的预测分数值（e.g. SVM，kNN & Decision Tree）

投票法的局限性

它对所有模型的处理是一样的，这意味着所有模型对预测的贡献是一样的。
如果一些模型在某些情况下很好，而在其他情况下很差，这是使用投票法时需要考虑到的一个问题。

voting实践

在这里插入图片描述

dataset –

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。