集成学习（2）——Adaboost（分类问题）

最新推荐文章于 2024-02-29 00:32:18 发布

VIP文章有dian意思

最新推荐文章于 2024-02-29 00:32:18 发布

阅读量569

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43455338/article/details/104851555

版权

集成学习一般来说可分为以下3个步骤：

找到误差互相独立的基分类器
训练基分类器
合并基分类器的结果

注意：不稳定的学习器更适合作为基分类器

Adaboost算法原理

AdaBoost算法针对不同的训练集训练同一个基本分类器（弱分类器），然后把这些在不同训练集上得到的分类器集合起来，构成一个更强的最终的分类器（强分类器）。理论证明，只要每个弱分类器分类能力比随机猜测要好，当其个数趋向于无穷个数时，强分类器的错误率将趋向于零。AdaBoost算法中不同的训练集是通过调整每个样本对应的权重实现的。

最开始的时候，每个样本对应的权重是相同的，在此样本分布下训练出一个基本分类器h1(x)。对于h1(x)错分的样本，则增加其对应样本的权重；而对于正确分类的样本，则降低其权重。这样可以使得错分的样本突出出来，并得到一个新的样本分布。同时，根据错分的情况赋予h1(x)一个权重，表示该基本分类器的重要程度，错分得越少权重越大。在新的样本分布下，再次对基本分类器进行训练，得到基本分类器h2(x)及其权重。依次类推，经过T次这样的循环，就得到了T个基本分类器，以及T个对应的权重。最后把这T个基本分类器按一定权重累加起来，就得到了最终所期望的强分类器。

确定基分类器
训练基分类器：假设训练集为 ${x_i,y_{i}},i=1,...,N$ ，其中 $y_i\in\{-1,1\}$ ，并且有T个基分类器，则可以按照如下过程来训练基分类器。
1. 初始化采样分布 $D_1(i)=1/N$ ;
2. 令 $t = 1, 2, . . ., T$ 循环
  1. 从训练集中，按照 $D_t$ 分布，采样出子集 $S_t=\{x_i,y_i\},i=1,...N_t$

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
集成学习（2）——Adaboost（分类问题）

集成学习一般来说可分为以下3个步骤：找到误差互相独立的基分类器训练基分类器合并基分类器的结果注意：不稳定的学习器更适合作为基分类器Adaboost算法原理AdaBoost算法针对不同的训练集训练同一个基本分类器（弱分类器），然后把这些在不同训练集上得到的分类器集合起来，构成一个更强的最终的分类器（强分类器）。理论证明，只要每个弱分类器分类能力比随机猜测要好，当其个数趋向于无穷个数时...
复制链接

扫一扫

专栏目录

有dian意思 CSDN认证博客专家 CSDN认证企业博客

码龄6年

122: 原创

5万+: 周排名

202万+: 总排名

9万+: 访问

: 等级

1825: 积分

71: 粉丝

94: 获赞

15: 评论

441: 收藏

私信

关注

热门文章

分类专栏

最新评论

最小二乘支持向量机LSSVM
ning_xinyue: 请问一下博主代码有GitHub链接吗
Python机器学习笔记-1（线性回归）
wananz: 博主，np.matrix(x.values)执行不了导致后面的代码都会出现问题，这个要怎么解决呢？
最小二乘支持向量机LSSVM
有dian意思: 是的，这里的y应该是γ，用的手写输入公式出现了笔误，感谢提醒，谢谢
最小二乘支持向量机LSSVM
骑猪来了: 他应该敲错了，确实是惩罚因子gamma
最小二乘支持向量机LSSVM
。听一半的曲: 大佬，我看了别的文献发现，LSSVM回归部分，最后的线性方程组，单位阵应该不是除y，而是惩罚系数。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。