[ML] 提升方法

最新推荐文章于 2024-08-30 21:34:59 发布

YasinQiu

最新推荐文章于 2024-08-30 21:34:59 发布

阅读量159

点赞数

分类专栏： ML

本文链接：https://blog.csdn.net/pangtouyu_qy/article/details/79573206

版权

ML 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

基本思想: 改变训练样本的权重, 学习多个分类器, 将分类器进行线性组合, 提高分类的性能.—”三个臭皮匠顶个诸葛亮”.

1. 提升方法AdaBoost算法

1.1 提升方法的思路

强可学习: 一个类, 存在一个多项式的学习算法能够学习它, 并且正确率高.
弱可学习: 一个类, 存在一个多项式的学习算法能够学习它, 正确率仅比随机猜测略好.
强可学习和弱可学习是等价的: 一个概念是强可学习的充要条件是该概念是弱可学习的.

1.1.1 Adaboost算法概述

先得到弱分类器, 然后用它们组成强分类器.
(1) 每一轮都要改变训练数据的权值分布: 提高前一轮被弱分类器错误分类的样本的权值, 使他们在下一轮得到更高的重视.
(2) 将弱分类器组合成强分类器: 给误差率小的弱分类器更高的权值, 使他们在分类中有更强的话语权.

1.2 Adaboost算法

使用二类分类的训练数据集 $T=\lbrace(x_1,y_1), ... ,(x_N, y_N) \rbrace$ .
输入: 训练数据集T和弱分类算法.
输出: 最终分类器G(x).
(1) 初始化训练数据的权值分布(每个样本的权值相同):
$D_1 = (w_{11}, ... ,w_{1N})$ 其中, $w_{1i}=\frac{1}{N}$
(2) 对于 $m = 1, ... ,M$
(a) 使用具有权值分布为D_m的数据集进行学习, 得到基本分类器:
$G_m(x):X→\lbrace-1, +1 \rbrace$
(b) 计算 $G_m(x)$ 的分类误差率:
$e_m = \displaystyle\sum_{i=1}^N w_{mi}I(G_m(x)≠y_i)$
(c) 计算 $G_m(x)$ 的系数:
$α_m = \frac{1}{2} \ln {\frac {1-e_m} {e_m}}$ , 明显可以看到 $e_m$ ↑, $α_m$ ↓
(d) 更新训练数据集的权值分布:
$D_{m+1} = (w_{m+1,1}, ... ,w_{m_1,N})$
$w_{m+1,i} = \frac{w_{mi} \exp{(-α_m y_iG_m(x_i))}}{\displaystyle\sum_{i=1}^N w_{mi} \exp{(-α_my_iG_m(x_i))}}$ , 该式调整的其实是 $w_{m+1,i}$ 之间的相对大小.
(3) 构建分类器的线性组合
$f(x) = \displaystyle\sum_{i=1}^N α_mG_m(x)$
得到最终分类器
$G(x) = sign(f(x))$

2. Adaboost算法的训练误差分析

Adaboost最基本的性质是它可以在学习的过程中不断减少训练误差.
Adaboost具有适应性, 能适应弱分类器各自的训练误差率, 这也是它名字的由来(适应的提升).

YasinQiu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[ML] 提升方法

基本思想: 改变训练样本的权重, 学习多个分类器, 将分类器进行线性组合, 提高分类的性能.—”三个臭皮匠顶个诸葛亮”.1. 提升方法AdaBoost算法1.1 提升方法的思路强可学习: 一个类, 存在一个多项式的学习算法能够学习它, 并且正确率高. 弱可学习: 一个类, 存在一个多项式的学习算法能够学习它, 正确率仅比随机猜测略好. 强可学习和弱可学习是等价的: 一个...
复制链接

扫一扫

专栏目录