SVM regression

最新推荐文章于 2023-06-13 16:51:10 发布

kakak_

最新推荐文章于 2023-06-13 16:51:10 发布

阅读量1.6k

点赞数

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/kakak_/article/details/105067978

版权

Machine Learning 专栏收录该内容

38 篇文章 2 订阅

订阅专栏

SVM回归模型损失函数

对于回归模型，要让训练集中的每个点(𝑥𝑖,𝑦𝑖)尽量拟合到一个线性模型𝑦𝑖 =𝑤∙𝜙(𝑥𝑖)+𝑏。
定义一个常量𝜖>0，对于某一个点， SVM回归模型的损失函数为:

$err(x_i,y_i) = \begin{cases} 0 & {|y_i - w \bullet \phi(x_i ) -b| \leq \epsilon}\\ |y_i - w \bullet \phi(x_i ) -b| - \epsilon & {|y_i - w \bullet \phi(x_i ) -b| > \epsilon} \end{cases}$
如果是均方差，只要𝑦𝑖−𝑤∙𝜙(𝑥𝑖)−𝑏≠0，那么就会有损失。

在蓝色条带里面的点都是没有损失的，但是外面的点的是有损失的，损失大小为红色线的长度。

SVM回归模型

定义SVM目标函数为

$min\;\; \frac{1}{2}||w||_2^2 \;\; s.t \;\; |y_i - w \bullet \phi(x_i ) -b| \leq \epsilon (i =1,2,...m)$
和分类模型相似，回归模型对每个样本(𝑥𝑖,𝑦𝑖)加入松弛变量𝜉𝑖 ≥ 0：

$min\;\; \frac{1}{2}||w||_2^2 + C\sum\limits_{i=1}^{m}(\xi_i^{\lor}+ \xi_i^{\land})$
$\;\;\; -\epsilon - \xi_i^{\lor} \leq y_i - w \bullet \phi(x_i ) -b \leq \epsilon + \xi_i^{\land}$
$\xi_i^{\lor} \geq 0, \;\; \xi_i^{\land} \geq 0 \;(i = 1,2,..., m)$

用拉格朗日函数将目标优化函数变成无约束的形式
$L(w,b,\alpha^{\lor}, \alpha^{\land}, \xi_i^{\lor}, \xi_i^{\land}, \mu^{\lor}, \mu^{\land}) = \frac{1}{2}||w||_2^2 + C\sum\limits_{i=1}^{m}(\xi_i^{\lor}+ \xi_i^{\land}) + \sum\limits_{i=1}^{m}\alpha^{\lor}(-\epsilon - \xi_i^{\lor} -y_i +$ $\bullet \phi(x_i) + b) + \sum\limits_{i=1}^{m}\alpha^{\land}(y_i - w \bullet \phi(x_i ) - b -\epsilon - \xi_i^{\land}) - \sum\limits_{i=1}^{m}\mu^{\lor}\xi_i^{\lor} - \sum\limits_{i=1}^{m}\mu^{\land}\xi_i^{\land}$
其中 $\mu^{\lor} \geq 0, \mu^{\land} \geq 0, \alpha_i^{\lor} \geq 0, \alpha_i^{\land} \geq 0$ 均为拉格朗日系数。
于是优化对象转化为
$\underbrace{min}_{w,b,\xi_i^{\lor}, \xi_i^{\land}}\; \;\;\;\;\;\;\;\;\underbrace{max}_{\mu^{\lor} \geq 0, \mu^{\land} \geq 0, \alpha_i^{\lor} \geq 0, \alpha_i^{\land} \geq 0}\;L(w,b,\alpha^{\lor}, \alpha^{\land}, \xi_i^{\lor}, \xi_i^{\land}, \mu^{\lor}, \mu^{\land})$
随后通过拉格朗日对偶，求偏导可得
$\frac{\partial L}{\partial w} = 0 \;\Rightarrow w = \sum\limits_{i=1}^{m}(\alpha_i^{\land} - \alpha_i^{\lor})\phi(x_i)$
$\frac{\partial L}{\partial b} = 0 \;\Rightarrow \sum\limits_{i=1}^{m}(\alpha_i^{\land} - \alpha_i^{\lor}) = 0$
$\frac{\partial L}{\partial \xi_i^{\lor}} = 0 \;\Rightarrow C-\alpha^{\lor}-\mu^{\lor} = 0$
$\frac{\partial L}{\partial \xi_i^{\land}} = 0 \;\Rightarrow C-\alpha^{\land}-\mu^{\land} = 0$
把上面4个式子带入 $L(w,b,\alpha^{\lor}, \alpha^{\land}, \xi_i^{\lor}, \xi_i^{\land}, \mu^{\lor}, \mu^{\land})$ 消去 $w,b,\xi_i^{\lor}, \xi_i^{\land}$ 。
求最大值时对目标函数取负号：
$\underbrace{ min}_{\alpha^{\lor}, \alpha^{\land}}\; \frac{1}{2}\sum\limits_{i=1,j=1}^{m}(\alpha_i^{\land} - \alpha_i^{\lor})(\alpha_j^{\land} - \alpha_j^{\lor})K_{ij} + \sum\limits_{i=1}^{m}(\epsilon-y_i)\alpha_i^{\land}+ (\epsilon+y_i)\alpha_i^{\lor}$
$\; \sum\limits_{i=1}^{m}(\alpha_i^{\land} - \alpha_i^{\lor}) = 0$
$\alpha_i^{\lor} < C \; (i =1,2,...m)$
$\alpha_i^{\land} < C \; (i =1,2,...m)$
SMO算法来求出 $\alpha_i^{\lor} , \alpha_i^{\land}$ ，进而得出回归模型系数𝑤, 𝑏。

回归模型系数的稀疏性

SVM分类模型中，对偶互补条件：
$\alpha_{i}^{*}(y_i(w \bullet \phi(x_i) + b) - 1+\xi_i^{*}) = 0$
回归模型中，对偶互补条件:
$\alpha_i^{\lor}(\epsilon + \xi_i^{\lor} + y_i - w \bullet \phi(x_i ) - b ) = 0$
$\alpha_i^{\land}(\epsilon + \xi_i^{\land} + y_i - w \bullet \phi(x_i ) - b ) = 0$
根据松弛变量定义，如果 |𝑦𝑖−𝑤∙𝜙(𝑥𝑖)−𝑏| < 𝜖，则 $\xi_i^{\lor} = 0, \xi_i^{\land}= 0$ ，此时 $\alpha_i^{\lor} = 0, \alpha_i^{\land}= 0$
$\sum\limits_{i=1}^{m}(\alpha_i^{\land} - \alpha_i^{\lor})\phi(x_i)$
𝑤不受在误差范围内的点的影响，只有在边界上或者在边界外的点影响𝑤的取值。