机器学习第六章：支持向量机

最新推荐文章于 2024-07-22 09:16:52 发布

colaj_49485675

最新推荐文章于 2024-07-22 09:16:52 发布

阅读量140

点赞数

文章标签：机器学习线性代数算法

本文链接：https://blog.csdn.net/weixin_49485675/article/details/120115060

版权

机器学习第六章：支持向量机

算法原理：从几何角度，对于线性可分数据集，支持向量机就是找距离正负样本都最远的超平面，相比于感知机，其解是唯一的，且不偏不倚，泛化性能更好。

n维空间的超平面（ $w^{T}x+b=0$ ,其中 $w,x\in R^{n}$ ）

超平面方程不唯一
法向量 $w$ 和位移项 $b$ 确定一个唯一超平面
法向量 $w$ 垂直于超平面（缩放 $w, b$ 时，若缩放倍数为负数会改变法向量方向）
法向量 $w$ 指向的那一半空间为正空间，另一半为负空间
任意一点到超平面的距离为： $r=\dfrac{|w^{T}x+b|}{||w||}$

几何间隔：对于给定的数据集X和超平面 $w^{T}x+b=0$ ,定义数据集X中任意一个样本点 $x_{i},y_{i}),y_{i}=\{-1,1\},i=1,2,...,m$ ,关于超平面的几何间隔为：
$\gamma_{i}=\dfrac{y_{i}(w^{T}x_{i}+b)}{||w||}$
正确分类时： $\gamma_{i}>0$ ,几何间隔也就等价于点到超平面的距离;
没有正确分类时： $\gamma_{i}<0$ ;

对于给定的数据集X和超平面 $w^{T}x+b=0$ ,定义数据集X关于超平面的几何间隔为数据集X中所有样本点的几何间隔最小值 $\gamma=min_{i=1,2,...,m}\gamma_{i}$

支持向量机

模型：给定线性可分的数据集X，支持向量机模型希望求得数据集X关于超平面的几何间隔 $\gamma$ 达到最大的那个超平面，然后套上一个sign函数实现分类功能：
$y=sign(w^{T}x+b)=\begin{cases}1,w^{T}x+b>0\\-1,w^{T}x+b<0\end{cases}$
几何间隔最大的超平面一定就是那个距离正负样本都最远的超平面；
因为：

当超平面没有正确划分正负样本时，几何间隔最小的为误分类点，因此 $\gamma<0$
当超平面正确划分超平面时， $\gamma\geq0$ ,且越靠近中央 $\gamma$ 越大

策略：给定线性可分数据集X,设X中几何间隔最小的样本为（ $x_{min},y_{min}$ ）,那么支持向量机找超平面的过程可以转化为以下带约束条件的优化问题：
$\max\ \gamma\\ s.t.\quad \gamma_{i}\geq\gamma,\ i=1,2,...,m\\$
$\max_{w,b}\quad \dfrac{y_{min(w^{T}x_{min}+b)}}{||w||}\\ s.t.\quad \dfrac{y_{i}(w^{T}x+b)}{||w||}\geq\dfrac{y_{min}(w^{T}x_{min}+b)}{||w||},\ i=1,2,...,m\\$

最低0.47元/天解锁文章

colaj_49485675

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习第六章：支持向量机

机器学习第六章：支持向量机算法原理：从几何角度，对于线性可分数据集，支持向量机就是找距离正负样本都最远的超平面，相比于感知机，其解是唯一的，且不偏不倚，泛化性能更好。n维空间的超平面（wTx+b=0w^{T}x+b=0wTx+b=0,其中w,x∈Rnw,x\in R^{n}w,x∈Rn）超平面方程不唯一法向量www和位移项bbb确定一个唯一超平面法向量www垂直于超平面（缩放w,bw,bw,b时，若缩放倍数为负数会改变法向量方向）法向量www指向的那一半空间为正空间，另一半为负空间任意一点到
复制链接

扫一扫