支持向量机
间隔与支持向量
划分超平面可通过如下线性方程来描述:
下图中的等式称为支持向量,二个等式之间的距离称为间隔。
目的就是找到最大间隔的划分超平面。
对偶问题
由上述式子可以得到对偶问题
最终得到如下公式
满足条件
核函数
异或问题就不是线性可分的。
核函数,支持向量展式
核函数定理
支持向量机 通过某非线性变换 φ( x) ,将输入空间映射到高维特征空间。特征空间的维数可能非常高。如果支持向量机的求解只用到内积运算,而在低维输入空间又存在某个函数 K(x, x′) ,它恰好等于在高维空间中这个内积,即K( x, x′) =<φ( x) ⋅φ( x′) > 。那么支持向量机就不用计算复杂的非线性变换,而由这个函数 K(x, x′) 直接得到非线性变换的内积,使大大简化了计算。这样的函数 K(x, x′) 称为核函数。
软间隔与正则化
为了缓解过拟合问题,引入软间隔的概念。
前面介绍的间隔为硬间隔,即所有样本都必须划分正确,而软间隔则允许有特例。
在最大化间隔的同时,不满足约束的样本应该尽可能的少,所以,优化目标可写成
人们通常使用一些其他函数来代替上述中的l,称为替代损失。
通常有以下三种
软间隔支持向量机(hinge损失)
接着引入松弛变量
得到的对偶问题
KKT条件
得出,软间隔支持向量机的最终模型仅与支持向量有关,即hinge损失函数仍然保持了稀疏性。
正则化
概念
支持向量回归(SVR)
就是通过一定的差值判断,而不是以前的必须完全相同才算正确的样例。
问题形式化:
其中的不敏感损失函数
引入松弛变量
最后可得
若考虑特征映射形式
核方法
定理
何为核方法