【机器学习课程-华盛顿大学】：3 分类 3.5 boosting

最新推荐文章于 2021-10-08 10:38:00 发布

有石为玉

最新推荐文章于 2021-10-08 10:38:00 发布

阅读量415

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41770169/article/details/80680349

版权

机器学习专栏收录该内容

63 篇文章 5 订阅

订阅专栏

1、提出boosting

简单的弱分类器很好计算，但是偏差很大。

下图说明，我们需要更强的分类器。

boosting在1990年代被提出来，现在在工业广泛应用，并且在kaggle比赛中频频获胜。

2、级联分类器

每一个特征进行分类，再进行投票

3、boosting

boosting：聚焦在困难的点上

给更重要的点加更大的权重：

4、adaboost

4.1 计算权重w

加权重的分类误差：

w权值计算公式：

4.2 计算ai

ai是用来矫正分类器犯错的，因此，当分类正确时，减小ai；分类错误时，增大ai。

4.3 ai归一化

经过多次迭代之后，ai可能变得很大，又或者很小，进行ai归一化。

5、adboost举例

（1）根据weighted_error最小，选出ft。然后根据此时的weighted_error，计算出权值w。

（2）重新计算ai

6、adaboost收敛和过拟合

adaboost过拟合：控制弱分类器的数量T。通过验证集来确定。如果数据集很大，就用验证集得到；如果数据集比较小，就通过交叉验证得到。

7、boosting的变种和相关算法

Gradient Boosting:跟adaboost类似

Random forest：随机森林

bagging：将数据集分成若干个子集，每个子集训练一棵树，最后的预测结果是这些树的平均。

8、boosting的影响

boosting是被人为的最有效的分类器之一。

计算机视觉中广泛应用；各大机器学习竞赛获胜算法（Kaggle，KDD Cup）；最常用的机器学习系统都是用的级联。

9、测试

答案为：0

x2作为分割特征分类时，全部分类正确，因此错误分类个数为0。weighted_error带入如下公式计算为0

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。