支持向量机-线性支持向量机和核函数

最新推荐文章于 2024-05-21 15:39:00 发布

bingxiash

最新推荐文章于 2024-05-21 15:39:00 发布

阅读量349

点赞数

分类专栏：机器学习算法

本文链接：https://blog.csdn.net/u014168855/article/details/104562784

版权

机器学习算法专栏收录该内容

18 篇文章 0 订阅

订阅专栏

1.目标函数：
若样本数据集线性不可分，则增加松弛因子 $\xi_{i} \geq 0$ ，使函数间隔加上松弛变量大于等于1，这样，约束条件变为
$y_{i}\left(w \cdot x_{i}+b\right) \geq 1-\xi_{i}$
目标函数为：
$\min _{w, b} \frac{1}{2}\|w\|^{2}+C \sum_{i=1}^{N} \xi_{i}$
$\text { s.t. } \quad y_{i}\left(w \cdot x_{i}+b\right) \geq 1-\xi_{i}, \quad i=1,2, \cdots, n$
2.带松弛因子的SVM拉格朗日函数及其计算：
$\xi, \alpha, \mu) \equiv \frac{1}{2}\|w\|^{2}+C \sum_{i=1}^{n} \xi_{i}-\sum_{i=1}^{n} \alpha_{i}\left(y_{i}\left(w \cdot x_{i}+b\right)-1+\xi_{i}\right)-\sum_{i=1}^{n} \mu_{i} \xi_{i}$
对 $\mathrm{w}, \mathrm{b}, \xi$ 分别求偏导
$\begin{aligned} &\frac{\partial L}{\partial w}=0 \Rightarrow w=\sum_{i=1}^{n} \alpha_{i} y_{i} \phi\left(x_{n}\right)\\ &\frac{\partial L}{\partial b}=0 \Rightarrow 0=\sum_{i=1}^{n} \alpha_{i} y_{i}\\ &\frac{\partial L}{\partial \xi_{i}}=0 \Rightarrow C-\alpha_{i}-\mu_{i}=0 \end{aligned}$
将三式带入L中得到
$\min _{w, b, \xi} L(w, b, \xi, \alpha, \mu)=-\frac{1}{2} \sum_{i=1}^{n} \sum_{j=1}^{n} \alpha_{i} \alpha_{j} y_{i} y_{j}\left(x_{i} \cdot x_{j}\right)+\sum_{i=1}^{n} \alpha_{i}$
对上式关于 $\alpha$ 的极大值，得到
$\begin{aligned} &\max _{a}-\frac{1}{2} \sum_{i=1}^{n} \sum_{j=1}^{n} \alpha_{i} \alpha_{j} y_{i} y_{j}\left(x_{i} \cdot x_{j}\right)+\sum_{i=1}^{n} \alpha_{i}\\ &\text { s.t. } \sum_{i=1}^{n} \alpha_{i} y_{i}=0\\ &\begin{array}{l} C-\alpha_{i}-\mu_{i}=0 \\ \alpha_{i} \geq 0 \\ \mu_{i} \geq 0, \quad i=1,2, \ldots, n \end{array} \quad 0 \leq \alpha_{i} \leq C \end{aligned}$
整理得到对偶问题：
$\min _{\alpha} \frac{1}{2} \sum_{i=1}^{n} \sum_{j=1}^{n} \alpha_{i} \alpha_{j} y_{i} y_{j}\left(x_{i} \cdot x_{j}\right)-\sum_{i=1}^{n} \alpha_{i}$
$\begin{aligned} &\text { s.t. } \sum_{i=1}^{n} \alpha_{i} y_{i}=0\\ &0 \leq \alpha_{i} \leq C, \quad i=1,2, \dots, n \end{aligned}$
构造并求解约束最优化问题：
$\min _{\alpha} \frac{1}{2} \sum_{i=1}^{n} \sum_{j=1}^{n} \alpha_{i} \alpha_{j} y_{i} y_{j}\left(x_{i} \cdot x_{j}\right)-\sum_{i=1}^{n} \alpha_{i}$
$\begin{array}{l} \text { s.t. } \sum_{i=1}^{n} \alpha_{i} y_{i}=0 \\ \qquad 0 \leq \alpha_{i} \leq C, \quad i=1,2, \ldots, n \end{array}$
求解得到最优解 $\alpha^*$
计算
$w^{*}=\sum_{i=1}^{n} \alpha_{i}^{*} y_{i} x_{i}$
$b^{*}=\frac{\max _{i: y_{i}=-1} w^{*} \cdot x_{i}+\min _{i: y_{i}=1} w^{*} \cdot x_{i}}{2}$
求得分离超平面 $w^{*} x+b^{*}=0$
分类决策函数
$f(x)=\operatorname{sign}\left(w^{*} x+b^{*}\right)$
3.损失函数分析
绿色：0/1损失；蓝色：SVM Hinge损失函数；红色：Logistic损失函数。
在这里插入图片描述
Logistic损失函数

4.核函数
可以使用核函数，将原始输入空间映射到新的特征空间，从而可以使得原本线性不可分的样本。常见的有三种核函数：
多项式核函数： $\kappa\left(x_{1}, x_{2}\right)=\left(x_{1} \cdot x_{2}+c\right)^{d}$
高斯核RBF函数： $\kappa\left(x_{1}, x_{2}\right)=\exp \left(-\gamma \cdot\left\|x_{1}-x_{2}\right\|^{2}\right)$
Sigmoid核函数： $\kappa\left(x_{1}, x_{2}\right)=\tanh \left(x_{1} \cdot x_{2}+c\right)$
（1）多项式核函数：
$\begin{aligned} &\kappa(\vec{x}, \vec{y})=(\vec{x} \cdot \vec{y})^{2}\\ &\Rightarrow\left(\sum_{i=1}^{n} x_{i} y_{i}\right)^{2}\\ &=\sum_{i=1}^{n} \sum_{j=1}^{n} x_{i} x_{j} y_{i} y_{j}\\ &=\sum_{i=1}^{n} \sum_{j=1}^{n}\left(x_{i} x_{j}\right)\left(y_{i} y_{j}\right) \end{aligned}$
特别的，n=3，即为：
$\Phi(\vec{x})=\left(\begin{array}{l} x_{1} x_{1} \\ x_{1} x_{2} \\ x_{1} x_{3} \\ x_{2} x_{1} \\ x_{2} x_{2} \\ x_{2} x_{3} \\ x_{3} x_{1} \\ x_{3} x_{2} \\ x_{3} x_{3} \end{array}\right)$
另外， $\begin{array}{l} \kappa(\vec{x}, \vec{y})=(\vec{x} \cdot \vec{y}+c)^{2} \\ \Rightarrow(\vec{x} \cdot \vec{y})^{2}+2 c \vec{x} \cdot \vec{y}+c^{2} \\ =\sum_{i=1}^{n} \sum_{j=1}^{n}\left(x_{i} x_{j}\right)\left(y_{i} y_{j}\right)+\sum_{i=1}^{n}\left(\sqrt{2 c} x_{i} \cdot \sqrt{2 c} x_{j}\right)+c^{2} \end{array}$
特别的，n=3，即为：
$\Phi(\vec{x})=\left(\begin{array}{c} x_{1} x_{1} \\ x_{1} x_{2} \\ x_{1} x_{3} \\ x_{2} x_{1} \\ x_{2} x_{2} \\ x_{2} x_{3} \\ x_{3} x_{1} \\ x_{3} x_{2} \\ x_{3} x_{3} \\ \sqrt{2 c} x_{1} \\ \sqrt{2 c} x_{2} \\ \sqrt{2 c} x_{3} \\ c \end{array}\right)$
核函数映射：
在这里插入图片描述
（2）高斯核
$\begin{aligned} &\kappa\left(x_{1}, x_{2}\right)=e^{\frac{\left|x_{1}-x_{2}\right|^{2}}{2 \sigma^{2}}}=e^{-\frac{\left(x_{1}-x_{2}\right)^{2}}{2 \sigma^{2}}}=e^{-\frac{x_{1}^{2}+x_{2}^{2}-2 x_{1} x_{2}}{2 \sigma^{2}}}=e^{-\frac{x_{1}^{2}+x_{2}^{2}}{2 \sigma^{2}}} \cdot e^{\frac{x_{1} x_{2}}{\sigma^{2}}}\\ &\begin{array}{l} =e^{-\frac{x_{1}^{2}+x_{2}^{2}}{2 \sigma^{2}}} \cdot\left(1+\frac{1}{\sigma^{2}} \cdot \frac{x_{1} x_{2}}{1 !}+\left(\frac{1}{\sigma^{2}}\right)^{2} \cdot \frac{\left(x_{1} x_{2}\right)^{2}}{2 !}+\left(\frac{1}{\sigma^{2}}\right)^{3} \cdot \frac{\left(x_{1} x_{2}\right)^{3}}{3 !}+\cdots+\left(\frac{1}{\sigma^{2}}\right)^{n} \cdot \frac{\left(x_{1} x_{2}\right)^{n}}{n !}+\cdots\right) \\ =e^{\frac{x^{2}+x^{2}}{2 \sigma^{2}}} \cdot\left(1 \cdot 1+\frac{1}{1 !} \frac{x_{1}}{\sigma} \cdot \frac{x_{2}}{\sigma}+\frac{1}{2 !} \cdot \frac{x_{1}^{2}}{\sigma^{2}} \cdot \frac{x_{2}^{2}}{\sigma^{2}}+\frac{1}{3 !} \cdot \frac{x_{1}^{3}}{\sigma^{3}} \cdot \frac{x_{2}^{3}}{\sigma^{3}}+\cdots+\frac{1}{n !} \cdot \frac{x_{1}^{n}}{\sigma^{n}} \cdot \frac{x_{2}^{n}}{\sigma^{n}}+\cdots\right) \\ =\Phi\left(x_{1}\right)^{T} \cdot \Phi\left(x_{2}\right) \end{array} \end{aligned}$
其中， $\Phi(x)=e^{-\frac{x^{2}}{2 \sigma^{2}}}\left(1, \sqrt{\frac{1}{1 !}} \frac{x}{\sigma}, \sqrt{\frac{1}{2 !}} \frac{x^{2}}{\sigma^{2}}, \sqrt{\frac{1}{3 !}} \frac{x^{3}}{\sigma^{3}}, \cdots, \sqrt{\frac{1}{n !}} \frac{x^{n}}{\sigma^{n}}, \cdots\right)$ 可以知道高斯核是无穷维。
5.总结和思考
SVM可以用作多分类，1 vs 1 / 1 vs rest
SVM和Logistic分类比较：SVM直接输出类别，Logistic输出属于哪个类别的后验概率。
SVM用于回归问题：SVR。

bingxiash

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
支持向量机-线性支持向量机和核函数

1.目标函数：若样本数据集线性不可分，则增加松弛因子ξi≥0\xi_{i} \geq 0ξi≥0，使函数间隔加上松弛变量大于等于1，这样，约束条件变为yi(w⋅xi+b)≥1−ξiy_{i}\left(w \cdot x_{i}+b\right) \geq 1-\xi_{i}yi(w⋅xi+b)≥1−ξi 目标函数为：min⁡w,b12∥w∥2+C∑i=1Nξi\min ...
复制链接

扫一扫

专栏目录