tsak3-boosting算法原理和思路拓展

最新推荐文章于 2023-07-25 21:34:05 发布

baidu_41253024

最新推荐文章于 2023-07-25 21:34:05 发布

阅读量255

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/baidu_41253024/article/details/115916632

版权

导读

提升（Boosting）方法是一种广泛有效的学习方法，在分类问题中，通过改变训练样本中的权重，学习多个分类器，并将分类器进行线性组合，提高分类的性能。

Boosting算法和Bagging算法的不同

Boosting算法使用同一组数据集进行反复学习，得到一系列简单模型，然后组合这些模型构成一个预测性更好的机器学习模型。与之前的Bagging不同，Bagging是全样本数据集进行抽样得到抽样子集，对不同的子集使用同一种基本模型进行拟合，然后投票得出最终的预测。两者的区别是使用模型数量的不同，并且Boosting是不断减少误差得到结果。

1 adaboost算法

1.1算法原理

假定一个二分类的训练数据集

$T = { ( x 1 , y 1 ) , ( x 2 , y 2 ) ,..., ( x N , y N ) }$

其中，每个样本点由实例和标记组成，x属于实例空间，y是标签，Adaboost从这些训练数据中学习一系列弱分类器或基本分类器，并将这些分类器组合成强分类器。

步骤如下：

1 在训练数据上训练样本，得到一个模型，查看该模型在整体数据和单个数据上的分类情况。

2如果该模型在整体数据上分类效果较好，那么该模型在最后的模型中占有较大比例

3如果该模型只在单个数据上分类好，那么在训练下一个模型时，调小单个数据的权重

4直到最后的分类结果达到目标，将所有的模型组合，得到强可学习模型

以统计学习书上的方法为例：

x为数据，y是标签，首先赋给初始权重

每个权重均为0.1

对于分类器1：

训练数据集上，遍历每个结点并计算分类误差率，阈值取v=2.5时分类误差率最低，那么基本分类器为

G(x)的误差为0.3

计算G1(x)的系数：

更新后的权重：

在权值分布D 2的训练数据集上，遍历每个结点并计算分类误差率e m e_mem，阈值取v=8.5时分类误差率最低，那么基本分类器为

误差为0.24

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tsak3-boosting算法原理和思路拓展

导读提升（Boosting）方法是一种广泛有效的学习方法，在分类问题中，通过改变训练样本中的权重，学习多个分类器，并将分类器进行线性组合，提高分类的性能。Boosting算法和Bagging算法的不同Boosting算法使用同一组数据集进行反复学习，得到一系列简单模型，然后组合这些模型构成一个预测性更好的机器学习模型。与之前的Bagging不同，Bagging是全样本数据集进行抽样得到抽样子集，对不同的子集使用同一种基本模型进行拟合，然后投票得出最终的预测。两者的区别是使用模型数量的不同，
复制链接

扫一扫

baidu_41253024 CSDN认证博客专家 CSDN认证企业博客

码龄7年

28: 原创

77万+: 周排名

7万+: 总排名

8264: 访问

: 等级

318: 积分

28: 粉丝

27: 获赞

4: 评论

41: 收藏

私信

关注

热门文章

最新评论

task2 ocr识别改进
CSDN-Ada助手: 非常感谢CSDN博主分享的<task2 ocr识别改进>的博客，我觉得文章内容十分实用，并且对于OCR识别算法的改进有很好的指导作用。我建议下一篇博客可以从<OCR识别算法优化>的角度出发，深入探讨如何提高OCR识别的准确率和效率，这对于需要进行大规模OCR识别的用户非常有帮助。相信会有更多的读者期待你的下一篇文章。为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
task2 ocr识别改进
大家一起学编程（python）: 大佬666
task-11 xgb算法实战
LaoYuanPython: 博主又出新作，辛苦了！算法研究很有前途！
Task2 数据分析与处理
qq_44321367: 大佬厉害

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。