Adaboost详解（附带基本公式推导）

最新推荐文章于 2022-01-19 04:46:57 发布

DemonHunter211

最新推荐文章于 2022-01-19 04:46:57 发布

阅读量1.8k

点赞数 3

分类专栏：算法

本文链接：https://blog.csdn.net/kwame211/article/details/80135899

版权

算法专栏收录该内容

415 篇文章 30 订阅

订阅专栏

Adaboost详解

第一次写博客，本人数学基础不是太好，如果有幸能得到读者指正，感激不尽，希望能借此机会向大家学习。这一篇的大部分内容都来自于《机器学习》这本书，以及自己的一些见解。MathJax还不会用，so公式都是我用MathType打出来后截图生成的。

预备知识：

这一部分主要是谈一谈Boosting的概念和原理，以及Adaboost中涉及到的基础数学公式即定理的推导。

弱学习器

　　弱学习器常指泛化性能略优于随机猜测的学习器，例如在二分类问题上精度略高于50%的分类器。——《机器学习》周志华 P171

Boosting（提升）

　　Boosting是一族可将弱学习器提升为强学习器的算法。这族算法的工作机制类似：先从初始训练集训练出一个基学习器，再根据基学习器的表现队训练集样本分布进行调整，使得先前基学习器做错的训练样本在后续受到更多关注，然后基于调整后的样本分布来训练下一个基学习器；如此反复进行，直至基学习器数目达到事先指定的值T，最终将这T个基学习器进行加权结合。——《机器学习》周志华 P173

加性模型（additive model）

其中，αtαt为每个基学习器的权值，ht(x)ht(x)为每个基学习器的预测结果。

数学期望的一条重要定理

　　若存在x∈X,y∈Yx∈X,y∈Y，且存在这样的映射Y=f(X)Y=f(X)，则可以得到，

其中，E(x)E(x)、E(y)E(y)分别为xx和yy的期望。

泰勒展开式

其中，f(n)(x)f(n)(x)表示f(x)f(x)的n阶导数，等号后的多项式称为函数f(x)f(x)在x0x0处的泰勒展开式，剩余的Rn(x)Rn(x)是泰勒公式的余项，是(x−x0)n(x−x0)n的高阶无穷小。
　　以下列举一些常用函数的泰勒公式：

推导过程

主要分为三部分：指数损失函数、基学习器的权值αtαt的更新和训练集样本分布Dt(x)Dt(x)的更新。

指数损失函数

　　若f(x)f(x)为样本xx的实际标签值，H(x)H(x)为样本的预测标签值，则指数损失函数可以表示为，

其中Ex~D[e−f(x)H(x)]Ex~D[e−f(x)H(x)]为样本服从分布DD时，e−f(x)H(x)e−f(x)H(x)的期望值，II(f(x)=1)II(f(x)=1)当f(x)=1f(x)=1时，等于1，否则为0。
　　若存在H(x)H(x)使得lexp(H|D)lexp(H|D)可以最小化，则可以将式子（1）对H(x)H(x)求偏导数，即