支持向量机Support Vector Machine(SVM)

最新推荐文章于 2023-02-05 11:22:15 发布

tigogogogo

最新推荐文章于 2023-02-05 11:22:15 发布

阅读量218

点赞数

分类专栏：机器学习文章标签：机器学习 SVM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43933420/article/details/87913072

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

二元SVM

SVM是一种有监督学习方法，因为它可以最大化几何边缘，所以又被称为最大间隔分类器

目标函数

$f(x)=\sum{w_ix_i} +b$

损失函数

$L=C\sum_i^n {max(0,1-y_if(x_i))}+\sum _i^n{w_i^2}$

即：当真实的label y_i 为1时，损失函数变为

$L=C\sum_i^n {max(0,1-f(x_i))}+\sum _i^n{w_i^2}$

此时的函数图像如下

此时，只要目标函数 f(x_i)>1 时损失就为0。

当真实的label y_i 为-1时，损失函数为

$L=C\sum_i^n {max(0,1+f(x_i))}+\sum _i^n{w_i^2}$

此时的函数图像如下

此时，只要目标函数 f(x_i)<-1 时，损失就为0。

为什么SVM是最大间隔分类器

根据SVM的损失函数，我们需要计算 f(x_i)=w_i^Tx (为方便计算，这里将偏置项b省略)，为了使损失最小，需要根据不同的label值，尽可能使得 f(x_i)>1 或者 f(x_i) <-1 。

而在线性代数中，我们可以将 w^Tx 转换成另外一种形式。举例来说，假设我们有向量 $A=\begin{bmatrix} x_1\\ x_2 \end{bmatrix}$ , $W=\begin{bmatrix} w_1\\ w_2 \end{bmatrix}$

则它们的内积 W^TA=p||W|| ,其中p为A在W上的投影，当p与w方向相同时为正数，否则为负数， ||W|| 为向量W的长度。

所以 f(x_i) = w_i^Tx=p_i||w|| , 我们要让其大于1或小于-1，由于损失函数中有加入w的长度作为正则项，我们需要减小 ||w|| ，增大 p_i 。假设 $W=\begin{bmatrix} 2\\ 1 \end{bmatrix}$ , $X=\begin{bmatrix} x_1\\ x_2 \end{bmatrix}$ ,为方便计算，省略偏置项b，则 W^TX=0 ，我们画出SVM的超平面（注意横纵坐标），如图

由于 W^TX=0 ，所以W和超平面垂直，由图可以看出，每个点在参数向量W的投影p都等于该点到超平面的距离，而我们正需要增大p，所以SVM可以最大化数据与分类超平面的间隔。

参考文献：http://blog.csdn.net/han_xiaoyang/article/details/52679559

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
支持向量机Support Vector Machine(SVM)

二元SVMSVM是一种有监督学习方法，因为它可以最大化几何边缘，所以又被称为最大间隔分类器目标函数损失函数即：当真实的label 为1时，损失函数变为此时的函数图像如下此时，只要目标函数时损失就为0。当真实的label 为-1时，损失函数为此时的函数图像如下此时，只要目标函数时，损失就为0。为什么SVM是最大间隔分类器根...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。