《机器学习》周志华-CH8（集成学习）

Next---YOLO

于 2024-09-24 20:22:48 发布

阅读量1.5k

点赞数 14

分类专栏：西瓜书文章标签：集成学习机器学习人工智能

本文链接：https://blog.csdn.net/m0_51366201/article/details/142469430

版权

8.1个体与集成

集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务，有时也被称为多分类器系统，基于委员会的学习。

在这里插入图片描述
同质”集成“：只包含同种类型的个体学习器，同质集成中的个体学习器亦称“基学习器”，相应的学习算法称为“基学习算法”

异质“集成”：由不同学习算法生成，不再有基学习法，称“组件学习器”。

集成学习常获得比单一学习器显著优越的泛化性能，对“弱学习器”尤为明显。

要想获得好的集成，个体学习器应“好而不同”，即个体学习器要有一定的“准确性”，并且也有差异“多样性”

以二分类问题 $y\in\{-1,+1\}$ 和函数 $f$ 为例，假定基分类器错误率为 $\xi$ ,对每个基分类器 $h_i$ 有：
$\begin{equation} P(h_i(x)\neq{f(x)})=\xi \tag{8.1} \end{equation}$
假设集成通过投票要对 $T$ 个基分类器判断，则超过半数为正确
$\begin{equation} H(x)=sign(\sum_{i=1}^Th_i(x)) \tag{8.2} \end{equation}$
集成错误率为：
$\begin{equation} P(H(x)\ne{f(x)})=sign(\sum_{k=0}^{T/2}\left[ \begin{matrix} T \\ K \\ \end{matrix} \right](1-\xi)\xi^{T-K}\leq{exp(-\frac{1}{2}T(1-2\xi )^2)} \tag{8.3} \end{equation}$