SVR简介

NGAHF

已于 2023-12-28 09:48:14 修改

阅读量1k

点赞数 22

文章标签：机器学习支持向量机算法

于 2023-12-26 15:41:50 首次发布

本文链接：https://blog.csdn.net/qq_44037525/article/details/135223649

版权

Support vector machine (SVM) analysis is a popular machine learning tool for classification and regression, first identified by Vladimir Vapnik and his colleagues in 1992. Linear epsilon-insensitive SVM (ε-SVM) regression is also known as $L_{1}$ loss. In ε-SVM regression, the set of training data includes predictor variables and observed response values. The goal is to find a function f(x) that deviates from $y_{n}$ by a value no greater than ε for each training point x, and at the same time is as flat as possible.

Linear SVM Regression: Primal Formula

原SVR问题：
$\begin{array}{l} \min_{\omega,b} \frac{1}{2}\|\omega\|^{2}+C\sum_{k=1}^N L_{\epsilon}(f(x_{k})-y_{k}) \\ L_{\epsilon}(z)=\left\{ \begin{array}{l} 0, \quad\quad if \, |z|<\epsilon \\ |z|-\epsilon,\quad otherwise \end{array} \right. \end{array}$
引入松弛变量 $\xi_{k},\xi_{k} ^{*}$ , 将上式重写
$\begin{array}{l} \min J(\omega)=\frac{1}{2}\omega^T\omega+C \sum_{k=1}^N(\xi_{k}+\xi_{k}^{*}) \\ s.t. \\ \quad\quad \begin{array}{l} y_{k}-(x_{k}^T\omega+b)\leq \epsilon+\xi_{k} \\ (x_{k}^T\omega+b)-y_{k}\leq\epsilon+\xi_{k}^{*} \\ \xi_{k}\geq 0 \\ \xi_{k}^{*}\geq 0 \end{array} \end{array}$

Linear SVM Regression: Dual Formula

$\begin{array}{l} L(\omega ,b,\xi ,{\xi ^*},\alpha ,{\alpha ^*},\mu ,{\mu ^*}) = \frac{1}{2}||\omega |{|^2} + C\sum\limits_{i = 1}^N {({\xi _i} + {\xi _i}^*)} \\ -\sum\limits_{i = 1}^N {{\mu _i}} {\xi _i} - \sum\limits_{i = 1}^N {{\mu _i}^*} {\xi _i}^* + \sum\limits_{i = 1}^N {{\alpha _i}} ({y_i} - f({x_i})-\epsilon - {\xi _i}) + \sum\limits_{i = 1}^N {{\alpha _i}^*} (f({x_i}) - {y_i}-\epsilon - {\xi _i}^*) \\ s.t. \quad \begin{array}{l} \alpha_{i}\geq 0, \alpha_{i}^{*}\geq 0 \\ \mu_{i}\geq 0, \mu_{i}^{*}\geq 0 \end{array} \end{array} \tag{3}$

KKT 偏导为0条件

$\begin{array}{l} \frac{\partial }{{\partial \omega }}L(\omega ,b,\xi ,{\xi ^*},\alpha ,{\alpha ^*},\mu ,{\mu ^*}) = \omega - \sum\limits_{i = 1}^N {{\alpha _i}} {x_i} + \sum\limits_{i = 1}^N {{\alpha _i}^*} {x_i} = 0 \\ \frac{\partial }{{\partial b}}L(\omega ,b,\xi ,{\xi ^*},\alpha ,{\alpha ^*},\mu ,{\mu ^*}) = - \sum\limits_{i = 1}^N {{\alpha _i}} + \sum\limits_{i = 1}^N {{\alpha _i}^*} = 0 \\ \frac{\partial }{{\partial {\xi _i}}}L(\omega ,b,\xi ,{\xi ^*},\alpha ,{\alpha ^*},\mu ,{\mu ^*}) = C - {\mu _i} - {\alpha _i} = 0 \\ \frac{\partial }{{\partial {\xi _i^*}}}L(\omega ,b,\xi ,{\xi ^*},\alpha ,{\alpha ^*},\mu ,{\mu ^*}) = C - {\mu _i^*} - {\alpha _i^*} = 0 \end{array}\tag{4}$
代入式(3)得

$\begin{array}{l} L(\omega ,b,\xi ,{\xi ^*},\alpha ,{\alpha ^*},\mu ,{\mu ^*}) = \frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {({\alpha _i} - {\alpha _i}^*)({\alpha _j} - {\alpha _j}^*){x_i}^T{x_j}} } + C\sum\limits_{i = 1}^N {({\xi _i} + {\xi _i}^*)} - \sum\limits_{i = 1}^N {{\mu _i}} {\xi _i} - \sum\limits_{i = 1}^N {{\mu _i}^*} {\xi _i}^*\\ +\sum\limits_{i = 1}^N {{y_i}({\alpha _i}} - {\alpha _i}^*) - \sum\limits_{i = 1}^N {\epsilon ({\alpha _i}} + {\alpha _i}^*) -\sum\limits_{i = 1}^N {{\alpha _i}} {\xi _i} - \sum\limits_{i = 1}^N {{\alpha _i}^*} {\xi _i}^* - \sum\limits_{i = 1}^N {({\alpha _i} - {\alpha _i}^*)} {x_i}^T\omega - \sum\limits_{i = 1}^N {({\alpha _i} - {\alpha _i}^*)} b\\ = -\frac{1}{2}\sum\limits_{i = 1}^N {\sum\limits_{j = 1}^N {({\alpha _i} - {\alpha _i}^*)({\alpha _j} - {\alpha _j}^*){x_i}^T{x_j}} } + \sum\limits_{i = 1}^N {{y_i}({\alpha _i}} - {\alpha _i}^*) - \sum\limits_{i = 1}^N {\epsilon ({\alpha _i}} + {\alpha _i}^*) \end{array}$

其余KKT条件
$\begin{array}{l} {\alpha _i}({y_i} - f({x_i}) - \epsilon - {\xi _i}) = 0\\ {\alpha _i}^*(f({x_i}) - {y_i} - \epsilon - {\xi _i}^*) = 0\\ {\mu _i}{\xi _i} = 0 \implies (C-\alpha_{i})\xi_{i}=0\\ {\mu _i}^*{\xi _i}^* = 0\implies(C-\alpha_{i}^{*})\xi_{i}^{*}=0\\ {\alpha _i} \ge 0,{\alpha _i}^* \ge 0\\ {\mu _i} \ge 0,{\mu _i}^* \ge 0 \end{array}$
解KKT条件，可得SVR解
$f(x)=\omega^Tx+b=\sum_{i=1}^N (\alpha_{i}-\alpha_{i}^{*})x_{i}^Tx+b$
仅当样本不落入 $\epsilon$ 间的隔带中，相应的 $\alpha_{i}$ 和 $\alpha_{i}^{*}$ 才能取非零值。
使上式中的 $\alpha_{i}-\alpha_{i}^{*}\neq 0$ 的样本即为SVR的支持向量，它们落在 $\epsilon$ 间的隔带之外。

在得到 $\alpha_{i}$ 后，若 $0<\alpha_{i}<C$ ，则必有 $\xi_{i}=0$ ，进而有
$b=y_{i}-\epsilon-\omega^Tx_{i}$
实践中采用更鲁棒的办法：选取多个或所有满足条件 $0<\alpha_{i}<C$ 的样本求解 b 后取平均值。

引入核函数，则有
$f(x)=\sum_{i=1}^N (\alpha_{i}-\alpha_{i}^{*})\phi(x_{i})^T\phi(x)+b$

参考资料

https://www.mathworks.com/help/stats/understanding-support-vector-machine-regression.html

NGAHF

关注

22
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
SVR简介

Support vector machine (SVM) analysis is a popular machine learning tool for classification and regression.
复制链接

扫一扫