boosting算法_深入浅出boosting算法

weixin_39983383

于 2020-11-28 03:39:49 发布

阅读量195

点赞数

文章标签： boosting算法

什么是监督学习？

给定一个样本集合

，其中，

特征
标签

我们希望找到下面的一个映射关系

示例

可以由以下几个简单函数叠加得到

三个臭皮匠顶个诸葛亮

加法模型(Additive Model)

另一种形式，

为基函数
为基函数系数

有了模型，接下来如何做？

objective & loss

定义模型的优化方向，也称损失

一些损失函数，例如

接下来问题是，如何做？

怎样求解这个模型
关键是如何求解损失函数

直接计算复杂度很高，换种形式

采用贪心的方法，将同时求解

所有参数

的目标函数转化成从前向后逐次求解各个

前向分布算法

forward stagewise additive modeling

initialize
for
1. compute
2. update

AdaBoost

当损失函数是指数函数时

其中，

是每个基模型

的权重

求解，

令

由于,

带入得到，

求解

,

接着带入

，对

求导,令导数值为0，求

，

已知，

计算得

算法描述

AdaBoost.M1 (Discrete AdaBoost)
initialize

for m = 1 to M:
fit classifier
to training data using weights

compute error rate

compute

update

output

in Adaboost,“shortcomings” are identified by high-weight data points

另一种思路

我们要通过分布迭代的方式求解

这个场景可以很容易想到一个经典的迭代求解算法 — 梯度下降

什么是梯度？

函数增长最大的方向

一阶泰勒展开

令

其中，

,

在

的小邻域内，

令

于是，

即，

取

负方向

整理公式，

得到，

其中，

与

这两个都是标量，可以合并到一起，最后得到

gradient boost

在有限样本空间中，

本身也是样本。因此，我们可以把

看成参数，用损失函数

对

求导

即，

求解，

通过线性搜索方法求解，

算法描述

gradient boost

for

一个简化的计算方法，可以直接用

去拟合负梯度

此时，我们将学习目标

转化成了在

处的负梯度

变成了一个回归问题

特点
不需要基函数对可导
可以适用于不同问题的损失函数

In Gradient Boosting,“shortcomings” are identified by gradients

参考

http://www.chengli.io/tutorials/gradient_boosting.pdf

https://statweb.stanford.edu/~jhf/ftp/trebst.pdf

https://explained.ai/gradient-boosting/L2-loss.html

https://blog.csdn.net/xsqlx/article/details/51330627

《统计学习方法》-李航

《Machine Learning A Probabilistic Perspective》

weixin_39983383

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。