支持向量机
一.基础知识
1 概念及定义
支持向量机是一个二类分类模型,基本模型的定义为:是在特征空间上的间隔最大的线性分类器
支持向量机学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面.
二次规划是一类典型的优化问题,包括凸二次优化和非凸二次优化
目标函数是变量的二次函数,约束条件是变量的线性不等式
核技巧(kernel trick):
一般用来解决非线性分类问题,将非线性问题转换成线性问题
第一步:首先使用一个变换将原空间的数据映射到新空间
第二步:在新的空间里用线性分类学习方法从训练数据中学习分类模型
2.专有概念及名词
函数间隔(functional margin):用 γ^=y(w⋅x+b) γ ^ = y ( w ⋅ x + b ) 来表示分类的正确性及确信度.
几何间隔(geometric margin):对分离超平面进行规范化,例如 ∥w∥=1 ‖ w ‖ = 1 ,这个时候函数间隔成为几何间隔.
样本点 (xi,yi) ( x i , y i ) 和超平面 (w,b) ( w , b ) 的几何间隔
取集合中所有样本点中几何间隔最小值
软间隔最大化:对于线性不可分的问题,通过修改约束条件实现数据的近似线性可分.叫做线性支持向量机的软间隔最大化
支持向量机不仅可以用于分类问题,在回归问题上也可以较好的使用.
支持向量回归(support vector regression)SVR:
支持向量回归有一个容忍偏差范围,当预计值和结果的偏差在范围(相当于间隔的一个区间)之内则认为预测是正确的.
二.思想脉络
所有的机器学习方法:
模型:就是假设空间的公式(条件概率分布和决策函数)
策略:选择最优的模型(利用损失函数,风险函数来进行选择)
算法:具体的计算方法(求解最优模型)
支持向量机的学习目标:
在特征空间中找到一个分离超平面,能够将实例分到不同的类,分离超平面对应于方程
由法向量和截距决定,分离超平面将特征空间分成两类,一部分是正类,一部分是负类.法向量指向的一侧为正类,另一侧为负类.
利用间隔最大化来寻找分离超平面
间隔最大化
求解间隔最大分离超平面,可表示为下面的约束最优化问题:
考虑到函数间隔和几何间隔之间的关系,可将问题改写成
函数间隔的取值不影响函数最优化问题的解.取 γ^=1 γ ^ = 1
注意到最大化 1∥w∥ 1 ‖ w ‖ 和最小化 12∥w∥2 1 2 ‖ w ‖ 2 是等价的.
得到线性可分支持向量机的学习最优化问题:
凸最优化问题
凸最优化问题变成凸二次规划问题(convex quadratic programming)
根据上述公式3求得最优解