0. 介绍
支持向量机,support vector machines,SVM,是一种二分类模型。
- 策略: 间隔最大化。这等价于正则化的合页损失函数最小化问题。
- 学习算法: 序列最小最优化算法SMO
- 分类 线性可分支持向量机,线性支持向量机、非线性支持向量机。
1、线性可分支持向量机
- 特点: 训练数据线性可分;策略为硬间隔最大化;线性分类器。
模型 分类决策函数:
分类超平面:
定义超平面关于样本点
的
函数间隔为:
定义超平面关于样本点
的
几何间隔:
几何距离是真正的点到面的距离。 定义所有样本点到面的距离的最小值:
间隔最大化:对训练集找到几何间隔最大的超平面,也就是充分大的确信度对训练数据进行分类。
以下通过最大间隔法和对偶法进行实现:
最大间隔法: 1)构造约束最优化函数
如果假设函数间隔
,易得 上述等价于:
2)解约束函数,即获得超平面
对偶法: 对偶算法可以使得问题更容易求解,并且能自然引入核函数,推广非线性分类。 1、定义拉格朗日函数
优化目标:
2、求
将
分别对
求偏导数,并令其等于0。
得:
3、求
对
的极大。 根据2中的结果,
求
对
的极大的对偶问题是: