支持向量机一：线性支持向量机介绍

最新推荐文章于 2022-06-28 15:17:31 发布

钉马掌的小铁匠

最新推荐文章于 2022-06-28 15:17:31 发布

阅读量441

点赞数 1

分类专栏：机器学习文章标签：机器学习算法支持向量机 svm

本文链接：https://blog.csdn.net/qq_39482438/article/details/106771836

版权

一、SVM简介

支持向量机（suport vector mechine，SVM）主要用于解决二分类问题。这里简单介绍一下线性SVM，希望能对SVM的入门者有所帮助。

SVM是如何对样本对进行分类的呢？假设我们有一组数据集 $D=\{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\}$ ，其中 $x_i$ 是第 $i$ 个实例， $y_i$ 是 $x_i$ 的分类标签，并且有 $y_i∈\{-1,1\}$ 。SVM通过一个超平面 $\omega·x+b=0$ 将不同类别的实例 $x_i$ 划分开，如下图。
在这里插入图片描述

二、分清几何间隔与函数间隔

对于各个实例点，其到超平面的几何间隔为 $d_i=\frac{|w.x_i+b|}{||w||}=y_i(\frac{w}{||w||}.x_i+\frac{b}{||w||}) \ \ ...\ \ (1)$ 如果你了解平面上点到直线的距离公式，你应该会很快了解这个公式的意义。除了几何间隔，还有一个定义叫做函数间隔，公式为： $d_l)_i=|w.x_i+b|=y_i(w.x_i+b) \ \ ...\ \ (2)$
我们定义 $d=min \ d_i$ ， $d_l=min (d_l)_i$ ，不难得出， $d_l$ 与 $d$ 的关系为 $d_l=d·||w|| \ \ ...\ \ (3)$

三、我们希望优化什么？

我们希望优化 $d$ ，使得d最大。相比于所有实例点距离超平面很近，我们希望更希望这些点距离超平面很远，因为这样会使我们更确信这个超平面能够将两种类别的实例分开。

仅仅优化 $d$ 就足够了吗？不够，我们不希望 $y_i(\frac{w}{||w||}.x_i+\frac{b}{||w||})$ 小于d，因此我们还需要加上 $y_i(\frac{w}{||w||}.x_i+\frac{b}{||w||})>=d$ 的约束条件。

于是我们得到我们需要优化的目标： $max\ \ d \\ s.t. \ \ y_i(\frac{w}{||w||}.x_i+\frac{b}{||w||})>=d$
将 $d$ 换成 $d_l$ ，
$max\ \ \frac{d_l}{||w||} \\ s.t. \ \ y_i(w.x_i+b)>=d_l$
设定函数间隔 $d_l=1$ ，并且不影响 $d$ ，因为根据公式(2)当 $d_l$ 扩倍n的话， $∣ ∣ w ∣ ∣$ 也会扩倍n，则根据公式(3)，有 $d=\frac{n.d_l}{n.||w_{old}||}=\frac{1}{||w_{new}||}$

最低0.47元/天解锁文章

钉马掌的小铁匠

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
支持向量机一：线性支持向量机介绍

SMO简介序列最小最优化算法（sequential minimal optimization，SMO）用于解决二次规划问题，其被提出的目的是解决支持向量机（support vector machines，SVM)的优化问题。SMO于1998年被John Platt提出，当时在SVM研究者的圈子里引起了很大的轰动，因为之前的优化算法都比较复杂并且低效。SVM简介这里简单介绍一下SVM，因为SMO的提出来自对SVM的求解。假设我们有一组数据集D={(x1,y1),(x2,y2),...,(xn,yn)}
复制链接

扫一扫