机器学习面试必知：一文理解支持向量机(SVM)

最新推荐文章于 2022-03-03 16:12:34 发布

Neekity

最新推荐文章于 2022-03-03 16:12:34 发布

阅读量632

点赞数

分类专栏：面试机器学习统计学习回归分类文章标签： SVM 支持向量机

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/neekity/article/details/87896623

版权

面试同时被 3 个专栏收录

39 篇文章 3 订阅

订阅专栏

39 篇文章 1 订阅

订阅专栏

23 篇文章 1 订阅

订阅专栏

1. 首先我们要是决策距离最大化

我们先来求点 $x$ 到一个超平面 $f(x)=w^{T}x+b$ 的距离：
假设有一点 $x$ ，垂直投影到超平面上对应点为 $x_{0}$ , $w$ 是垂直于超平面的一个向量， $\gamma$ 为样本 $x$ 到超平面的距离。易知 $x=x_{0}+\gamma \frac{w}{||w||}$ , 同乘 $w^{T}$ , $w^{T}x=w^{T}x_{0}+\gamma w^{T} \frac{w}{||w||}$ 。因为 $w^{T}x_{0}=-b$ ，所以可以化解为 $w^{T}x+b=\gamma\frac{||w||^{2}}{||w||}$ ，可以得到 $\gamma=\frac{f(x)}{||w||}$ ，这里我们只关心那些分类正确的点 $\frac{t_{n}f(x_{n})}{||w||},t_{n}f(x_{n}) \geqslant 1$ 。所以我们就有了目标函数 $max\frac{1}{||w||}=min 0.5*||w||^{2}$ $\mathrm{s.t.} (w^{T}\phi(x_{n})+b) t_{n} \geqslant 1, n=1,...,N$
为了更好地引出核函数，我们假设先对x做了一个预处理 $\phi(x)$

2. 变换到对偶问题求解出 $w$
$L(w,a,b)=\frac{1}{2}||w||^{2}-\sum_{n=1}^{N}a_{n}( (w^{T}\phi(x_{n})+b) t_{n} -1)$

首先固定 $a$ ，让L分别对w和b求偏导等于0得到 $w=\sum_{n=1}^{N}a_{n}t_{n}\phi(x_{n})$ $\sum_{n=1}^{N}a_{n}t_{n}=0$ 将结果代入得到 $L(a)=\sum_{n=1}^{N}a_{n}-\frac{1}{2}\sum_{n=1}^{N}\sum_{m=1}^{N}a_{n}a_{m}t_{n}t_{m}K(x_{n},x_{m})$
求解a的极大化,其中 $K(x_{n},x_{m})=\phi^{T}(x_{n})\phi(x_{m})$ 是核函数 $\left \{ \sum_{n=1}^{N}a_{n}-\frac{1}{2}\sum_{n=1}^{N}\sum_{m=1}^{N}a_{n}a_{m}t_{n}t_{m}K(x_{n},x_{m}) \right \}$ $\textbf{s.t. } a_{n}\geqslant 0,\sum_{n=1}^{N}a_{n}t_{n}=0,K(x_{n},x_{m})=\phi^{T}(x_{n})\phi(x_{m})$

3. 求解b

我们把w代入可以超平面得 $f(x)=\sum_{n=1}^{N}a_{n}t_{n}K(x,x_{n})+b$ 利用KKT条件得到 $a_{n}\geqslant 0$ $t_{n}f(x_{n})-1 \geqslant 0$ $a_{n}\left\{ t_{n}f(x_{n})-1\right\}=0$ 所以只存在两种情况要吗 $a_{n}=0$ 此时 $x_{n},t_{n})$ 是无关数据或者 $a_{n} \neq 0,t_{n}f(x_{n})-1=0$ 此时 $x_{n},t_{n})$ 是决策边缘边界上的点。从这里可以看出SVM仅仅与决策边界上的数据点有关，与其余的数据点无关。假设有效的点分布在一个S空间中那么我们用支持向量 $x_{n}$ 就能确定b。由 $t_{n}f(x_{n})=1$ 我们可以得到(其中 $N_{S}$ 是支持向量的总数量) $t_{n}\left\{\sum_{m\in S}a_{m}t_{m}K(x_{n},x_{m})+b\right\}=1$ $t_{n}^{2}\left\{\sum_{m\in S}a_{m}t_{m}K(x_{n},x_{m})+b\right\}=t_{n}$ $b=\frac{1}{N_{S}}\sum_{n\in S}\left\{t_{n}-\sum_{m\in S}a_{m}t_{m}K(x_{n},x_{m})\right\}$

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习面试必知：一文理解支持向量机(SVM)

1. 首先我们要是决策距离最大化我们先来求点xxx到一个超平面f(x)=wTx+bf(x)=w^{T}x+bf(x)=wTx+b的距离：假设有一点xxx，垂直投影到超平面上对应点为x0x_{0}x0, www是垂直于超平面的一个向量， γ\gammaγ为样本xxx到超平面的距离。易知x=x0+γw∣∣w∣∣x=x_{0}+\gamma \frac{w}{||w||}x=x0+γ∣∣w∣...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。