人工智能/机器学习基础知识——支持向量机(Support Vector Machine,SVM)

支持向量机

Support Vector Machine(SVM)

  • 距离超平面最近的这几个训练样本点使等号成立,它们被称为“支持向量”

  • 求解SVM最优化:SMO(Sequential Minimal Optimization)

    在这里插入图片描述

核函数

  • 上述例子在二维平面上,训练样本假设是线性可分的,然而在现实任务中,原始样本空间可能本身就线性不可分,所以可以将原始空间映射到一个更高维的特征空间,使得样本在这个特征空间线性可分

    • 如果原始空间是有限维,即属性数有限,那么一定存在一个高维特征空间使样本可分
  • 由于SVM最优化涉及计算映射到高维空间后的样本向量的点积,由于特征空间维数可能很高,因此直接计算比较困难,故设计了核函数,避免直接计算高维向量内积

    κ ( x i , x j ) = ⟨ ϕ ( x i ) , ϕ ( x j ) ⟩ = ϕ ( x i ) T ϕ ( x j ) \kappa\left(\boldsymbol{x}_{i}, \boldsymbol{x}_{j}\right)=\left\langle\phi\left(\boldsymbol{x}_{i}\right), \phi\left(\boldsymbol{x}_{j}\right)\right\rangle=\phi\left(\boldsymbol{x}_{i}\right)^{\mathrm{T}} \phi\left(\boldsymbol{x}_{j}\right) κ(xi,xj)=ϕ(xi),ϕ(xj)=ϕ(xi)Tϕ(xj)

  • 常用核函数

    在这里插入图片描述

    • 文本数据通常采用线性核,情况不明时先尝试高斯核(RBF)

软间隔支持向量机

Soft Margin

  • 前述讨论假设存在超平面将样本完全分隔开,但往往很难找到这样的超平面,难免会有一些不满足条件的样本。缓解该问题的方法是允许SVM在一些样本上出错,为此引入“软间隔”概念。

    在这里插入图片描述

  • 在最大化间隔的同时,不满足约束的样本应尽可能少,优化目标可写为(采用Hinge Loss衡量不满足约束的样本误差)

    min ⁡ w , b 1 2 ∥ w ∥ 2 + C ∑ i = 1 m max ⁡ ( 0 , 1 − y i ( w T x i + b ) ) \min _{\boldsymbol{w}, b} \frac{1}{2}\|\boldsymbol{w}\|^{2}+C \sum_{i=1}^{m} \max \left(0,1-y_{i}\left(\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}_{i}+b\right)\right) w,bmin21w2+Ci=1mmax(0,1yi(wTxi+b))

支持向量回归

Support Vector Regression,SVR

在这里插入图片描述

  • SVR仅当预测值与真实值之间的误差绝对值大于 ε ε ε时才计算损失

    min ⁡ w , b 1 2 ∥ w ∥ 2 + C ∑ i = 1 m ℓ ε ( f ( x i ) − y i ) \min _{\boldsymbol{w}, b} \frac{1}{2}\|\boldsymbol{w}\|^{2}+C \sum_{i=1}^{m} \ell_{ε}\left(f\left(\boldsymbol{x}_{i}\right)-y_{i}\right) w,bmin21w2+Ci=1mε(f(xi)yi)
    ℓ ε \ell_{ε} ε为ε-insensitive loss

    ℓ ϵ ( z ) = { 0 ,  if  ∣ z ∣ ⩽ ϵ ∣ z ∣ − ϵ ,  otherwise  \ell_{\epsilon}(z)= \begin{cases}0, & \text { if }|z| \leqslant \epsilon \\ |z|-\epsilon, & \text { otherwise }\end{cases} ϵ(z)={0,zϵ, if zϵ otherwise 

核方法

使用核函数的学习方法

  • 核线性判别分析

    Kernelized Linear Discriminant Analysis,KLDA

  • 22
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值