Coursera - 机器学习技法 - 课程笔记 - Week 2

最新推荐文章于 2024-08-01 20:59:33 发布

支锦铭

最新推荐文章于 2024-08-01 20:59:33 发布

阅读量163

点赞数

分类专栏： Cousera-课程笔记文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/cary_leo/article/details/105911474

版权

Cousera-课程笔记专栏收录该内容

141 篇文章 17 订阅

订阅专栏

Dual Support Vector Machine

Motivation of Dual SVM

非线性SVM：直接将 $\bold x$ 换成 $\bold z = \Phi(\bold x)$
QP问题处理 $\tilde d + 1$ 个变量， $N$ 个约束
对偶问题，有 $N$ 个变量， $N + 1$ 个约束，与转换的空间无关
利用拉格朗日乘子法，将所有的 $\lambda$ 视作未知参数，从而将有约束优化问题转换为无约束优化问题（实际上是把约束条件内含了）

$\mathcal{L}(b, \bold w, \alpha) = \frac12 \bold w^{\mathrm{T}} \bold w + \sum_{n = 1}^N \alpha_n (1 - y_n(\bold w^{\mathrm{T}} \bold z_n + b))$

SVM实际上变成了 $\min_{b, \bold w} (\max_{\alpha_n \ge 0} \mathcal L (b, \bold w, \alpha))$
- 对任何违反规则的点， $y_n(\bold w^{\mathrm{T}} \bold z_n + b) \lt 1$ ，此时括号内最优化结果为无意义的正无穷（肯定找可行情形的值作为“最小值”）
- 对任何可行的点， $y_n(\bold w^{\mathrm{T}} \bold z_n + b) \ge 1$ ，此时括号内的最佳情形为所有的 $\alpha$ 为0，目标回到 $\min \frac12 \bold w^{\mathrm{T}} \bold w$

Lagrange Dual SVM

拉格朗日对偶问题： $\min_{b, \bold w} (\max_{\alpha_n \ge 0} \mathcal L (b, \bold w, \alpha)) \ge \max_{\alpha^\prime \ge 0} (\min_{b, \bold w} \mathcal{L}(b, \bold w, \alpha^\prime))$
最小化上界 -> 最大化下界
在QP问题中，可以在一定条件下将上述弱对偶问题转换为强对偶问题
- 原问题为凸
- 原问题可解
- 线性约束
强对偶关系下，两侧的结果一样
对偶形式：

$\max_{\alpha_n \ge 0} \left ( \min_{b, \bold w} \frac{1}{2} \bold w^{\mathrm{T}} \bold w + \sum_{n = 1}^N \alpha_n (1 - y_n(\bold w^{\mathrm{T}} \bold z_n + b)) \right )$

内部问题无约束，最优情形
- $KaTeX parse error: Undefined control sequence: \part at position 7: \frac{\̲p̲a̲r̲t̲ ̲\mathcal L(b, \…$
- 可以加入这个约束条件 $\sum_{n = 1}^N \alpha_n y_n = 0$ ，并不影响最优解
$b$ 可以被移除

$\max_{\alpha_n \ge 0 ,\ \sum y_n \alpha_n = 0} \left ( \min_{\bold w} \frac{1}{2} \bold w^{\mathrm{T}} \bold w + \sum_{n = 1}^N \alpha_n (1 - y_n(\bold w^{\mathrm{T}} \bold z_n)) \right )$

内部问题仍然是无约束的，最优情形
- $KaTeX parse error: Undefined control sequence: \part at position 7: \frac{\̲p̲a̲r̲t̲ ̲\mathcal L(b, \…$
- 可解 $\bold w = \sum_{n = 1}^N \alpha_n y_n \bold z_n$
继续简化

$\max_{\alpha_n \ge 0 ,\ \sum y_n \alpha_n = 0 ,\ \bold w = \sum \alpha_n y_n \bold z_n} -\frac{1}{2} \|\sum_{n = 1}^N \alpha_n y_n \bold z_n \|^2 + \sum_{n = 1}^N \alpha_n$

KKT条件：
- 原问题可解 $y_n(\bold w^{\mathrm{T}} \bold z_n + b) \ge 1$
- 对偶问题可解 $\alpha_n \ge 0$
- 对偶问题的内部最优化 $\sum y_n \alpha_n = 0 ,\ \bold w = \sum \alpha_n y_n \bold z_n$
- 原为题的内部最优化 $\alpha_n (1 - y_n(\bold w^{\mathrm{T}} \bold z_n + b)) = 0$ （最优情形下，拉格朗日项消失）——互补松弛性（两个部分至少一个为0）

Solving Dual SVM

硬间隔SVM对偶形式

$\begin{aligned} \min_\alpha &\quad \frac12 \sum_{n = 1}^N \sum_{m = 1}^M \alpha_n \alpha_m y_n y_m \bold z_n^{\mathrm{T}} \bold z_n - \sum_{n = 1}^N \alpha_n \\ \operatorname{s.t.} &\quad \sum_{n = 1}^N y_n \alpha_n = 0 \\ &\quad \alpha_n \ge 0, n = 1, 2, \ldots, N \end{aligned}$

QP系数：
- $q_{n, m} = y_n y_m \bold z_n^{\mathrm{T}} \bold z_n$
- $\bold p = - \bold 1_N$
- $\bold a \ge y, \bold a \le -y, \bold a_n^{\mathrm{T}} = 第n个单位向量$
- $\ge 0, c\le 0, c_n = 0$
$\alpha > 0$ 时， $y_n(\bold w^{\mathrm{T}} \bold z_n + b) = 1$ ，此时样本点为SV

Messages behind Dual SVM

只认为 $\alpha > 0$ 的样本点为SV
可以只用SV的信息计算 $\bold w$
使用任意一个SV计算 $b$
和PLA，SGD等类似，权重可以被数据表现出来
- 在SVM中， $\bold w$ 只需要使用SV表示出来

支锦铭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Coursera - 机器学习技法 - 课程笔记 - Week 2

Dual Support Vector MachineMotivation of Dual SVM非线性SVM：直接将x\bold xx换成z=Φ(x)\bold z = \Phi(\bold x)z=Φ(x)QP问题处理d~+1\tilde d + 1d~+1个变量，NNN个约束对偶问题，有NNN个变量，N+1N + 1N+1个约束，与转换的空间无关利用拉格朗日乘子法，...
复制链接

扫一扫

专栏目录