人工智能/机器学习基础知识——支持向量机（Support Vector Machine，SVM）

最新推荐文章于 2024-07-12 23:33:56 发布

ZreviaX

最新推荐文章于 2024-07-12 23:33:56 发布

阅读量736

点赞数 22

分类专栏：人工智能/机器学习基础知识文章标签：支持向量机人工智能机器学习 SVM

本文链接：https://blog.csdn.net/WindGrin_/article/details/137688571

版权

31 篇文章 0 订阅

订阅专栏

支持向量机

Support Vector Machine（SVM）

上述例子在二维平面上，训练样本假设是线性可分的，然而在现实任务中，原始样本空间可能本身就线性不可分，所以可以将原始空间映射到一个更高维的特征空间，使得样本在这个特征空间线性可分
- 如果原始空间是有限维，即属性数有限，那么一定存在一个高维特征空间使样本可分
由于SVM最优化涉及计算映射到高维空间后的样本向量的点积，由于特征空间维数可能很高，因此直接计算比较困难，故设计了核函数，避免直接计算高维向量内积

$\kappa\left(\boldsymbol{x}_{i}, \boldsymbol{x}_{j}\right)=\left\langle\phi\left(\boldsymbol{x}_{i}\right), \phi\left(\boldsymbol{x}_{j}\right)\right\rangle=\phi\left(\boldsymbol{x}_{i}\right)^{\mathrm{T}} \phi\left(\boldsymbol{x}_{j}\right)$
常用核函数
- 文本数据通常采用线性核，情况不明时先尝试高斯核（RBF）

Soft Margin

前述讨论假设存在超平面将样本完全分隔开，但往往很难找到这样的超平面，难免会有一些不满足条件的样本。缓解该问题的方法是允许SVM在一些样本上出错，为此引入“软间隔”概念。
在最大化间隔的同时，不满足约束的样本应尽可能少，优化目标可写为（采用Hinge Loss衡量不满足约束的样本误差）

$\min _{\boldsymbol{w}, b} \frac{1}{2}\|\boldsymbol{w}\|^{2}+C \sum_{i=1}^{m} \max \left(0,1-y_{i}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}+b\right)\right)$

Support Vector Regression，SVR

在这里插入图片描述

SVR仅当预测值与真实值之间的误差绝对值大于 $ε$ 时才计算损失

$\min _{\boldsymbol{w}, b} \frac{1}{2}\|\boldsymbol{w}\|^{2}+C \sum_{i=1}^{m} \ell_{ε}\left(f\left(\boldsymbol{x}_{i}\right)-y_{i}\right)$
$\ell_{ε}$ 为ε-insensitive loss

$\ell_{\epsilon}(z)= \begin{cases}0, & \text { if }|z| \leqslant \epsilon \\ |z|-\epsilon, & \text { otherwise }\end{cases}$