机器学习----集成学习（Boosting）

最新推荐文章于 2025-03-10 10:51:47 发布

这题我会啊

最新推荐文章于 2025-03-10 10:51:47 发布

阅读量3.7k

点赞数 1

分类专栏： machine-learning 文章标签：机器学习集成学习 AdaBoost

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Love_wanling/article/details/70238403

版权

Boosting是一族可将弱学习器提升为强学习器的算法。这族算法的工作机制类似：
先从初始训练集训练出一个基学习器，再根据基学习器的表现对训练样本分布进行调整，使得先前基学习器做错的样本在后面受到更多关注。

AdaBoost

一直觉得AdaBoost这个名字起得好呀，全拼是Adaptive Boosting；adaptive是适应的，适合额意思。但是世界上第一个程序媛不也叫Ada嘛~
这里写图片描述
haha~扯远了。我们看看AdaBoost是怎么提升正确率的。

实现

在理论推导之前我们先看看它到底是怎么做的。
现在我们有训练集 $D=\{(\mathbf{x_1},y_1),(\mathbf{x_2},y_2), ... ,(\mathbf{x_m},y_m)\}$ ,基学习算法 $\varphi$ 。其中 $Y\in\{-1,+1\}$

第一次训练我们就像平常一样，每个样例的权重为 $1 / m$ 。
我们为每个训练好的学习器附加权重，因为我们最后要线性求和学习器输出结果。这个权重怎么分配呢？我们让它与分类错误率挂钩。设第k个学习器的分类错误率为 $\epsilon_k$ ，则权重为
$\alpha_k=\frac{1}{2}ln(\frac{1-\epsilon_t}{\epsilon_t})$
为了下一次的基学习器的训练，我们需要改变样本权重，大致思想为，这次分类对的缩小权重，这个分类错的，加大。这个权重的变更也跟 $\epsilon_k$ 有关：
$D_{k+1}(x)=\frac{D_k(\mathbf{x})}{Z_k}\times\begin{cases} exp(-\alpha_k),if h_k(\mathbf{x})=f(\mathbf{x})\\ exp(\alpha_k),if h_k(\mathbf{x})\neq f(\mathbf{x}) \end{cases}\\ =\frac{D_k(\mathbf{x})}{Z_k}\times exp(-\alpha_kf(\mathbf{x})h_k(\mathbf{x}))$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。