以AdaBoost算法为例，详解集成学习的思想（二）

最新推荐文章于 2022-02-22 14:50:07 发布

_ToDream

最新推荐文章于 2022-02-22 14:50:07 发布

阅读量209

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x18835129278/article/details/79557095

版权

机器学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

接下来介绍Boosting族算法中最著名的AdaBoost算法，其基本思想如下：
1、改变训练数据的权值或概率分布，提高前一轮弱分类器分错的样本的权值，降低分类正确的样本的权值（体现在什么地方？乘以exp()）。举个例子，我们平时记单词，总是选择前一天没有记下来的单词进行强化训练。
2、如何将弱分类器组合成一个强分类器？加大分类错误率小的基分类器的权值，降低分类错误率大的基分类器的权值。
AdaBoost算法是加法模型和前向分步算法的结合，使用的是指数损失函数。
0-1损失函数：
指数损失函数： 指数损失函数是0-1损失函数的一种代理函数。
损失函数介绍

下面介绍算法的详细推导过程：从基于加法模型迭代式优化指数损失函数的角度推导。
推导1
推导2
算法大致流程如下：

Boosting算法要求基学习器能对特定的数据分布进行学习，这可以通过重赋权值实施，即在训练过程的每一轮中，根据样本分布为每个训练样本重新赋一个权重。

对无法接受带权样本的基学习算法，则可以通过重采样法来处理，即在每一轮的学习中，根据样本分布对训练集重新进行采样，然后训练基学习器。

一般而言，这两种做法没有显著的优劣差别。

Boosting算法在训练的每一轮都要检查当前的生成的基学习器的正确率大于0.5，若不满足，则当前学习器被抛弃，且学习过程停止。此时可采用重采样法，抛弃不满足条件的基学习器之后，根据当前分布重新对训练样本进行采样，重新训练基学习器，直到满足训练次数T。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
以AdaBoost算法为例，详解集成学习的思想（二）

接下来介绍Boosting族算法中最著名的AdaBoost算法，其基本思想如下： 1、改变训练数据的权值或概率分布，提高前一轮弱分类器分错的样本的权值，降低分类正确的样本的权值（体现在什么地方？乘以exp()）。举个例子，我们平时记单词，总是选择前一天没有记下来的单词进行强化训练。 2、如何将弱分类器组合成一个强分类器？加大分类错误率小的基分类器的权值，降低分类错误率大的基分类器的权值。 A...
复制链接

扫一扫

专栏目录

_ToDream CSDN认证博客专家 CSDN认证企业博客

码龄10年

53: 原创

6万+: 周排名

125万+: 总排名

17万+: 访问

: 等级

1910: 积分

15: 粉丝

48: 获赞

12: 评论

203: 收藏

私信

关注

热门文章

分类专栏

其他 2篇
mysql 1篇
机器学习 18篇
vbs
cmd 1篇
统计 2篇
C++
集群 1篇

最新评论

Python爬取Alexa.cn上Top500的网址
liuhongyue: 这个网址是对的吗怎么跟我看到的排名不一样
Python爬取Alexa.cn上Top500的网址
m0_69952407: 博主，问一下就是要500个网址，然后是国内能用的怎么弄一下啊，昨天按你这个弄的，发现有的Url不能打开
anaconda3激活
啵比是coolguy: 我用了 conda init然后关闭终端，打开另一个终端就有base了
anaconda3激活
啵比是coolguy: 我用了 conda init然后关闭终端，打开另一个终端就有base了
python对坐标轴进行调整
Pinkky_Tigger: 想增加文章可读性，可以烦请增加一些解释性文字。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。