SVM

最新推荐文章于 2024-07-11 18:30:49 发布

缦旋律

最新推荐文章于 2024-07-11 18:30:49 发布

阅读量134

点赞数

分类专栏：机器学习

小陈一行一行地敲出来的啦~

本文链接：https://blog.csdn.net/weixin_41391619/article/details/116274297

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

本文概述了SVM的基本问题，包括通过线性超平面决策边界、支持向量的概念，以及如何通过拉格朗日函数转化为对偶问题。重点讲解了核函数在处理非线性可分数据的重要性，介绍了常见的核函数类型，并介绍了软间隔概念，讨论了C参数对模型选择的影响。

摘要由CSDN通过智能技术生成

1.SVM的基本问题

在这里插入图片描述

       在样本空间中，划分超平面(又称为决策边界)可以通过如下线性方程表示：
$w^ Tx+b =0$
       决策边界位于两条虚线超平面的中间，对于位于虚线超平面上的点(称为支持向量)，有
$w \cdot x + b = k ， w \cdot x + b = - k$
       两个表达式同时除以k，则可以得到：
$w \cdot x + b = 1 ， w \cdot x + b = - 1$
       以上就是两条虚线超平面的表达式，1和-1分别表达了这两条虚线到决策超平面的相对距离。
令紫色的支持向量为 $x_{p}$ ,红色的支持向量为 $x_{r}$ ，则有：
$w·x_{p}+b=1， w·x_{r}+b=-1$
       两式相减可得：
$w·(x_{p}-x_{r})=2$
       其中 $x_{p}-x_{r}$ 是 $x_{p}$ 、 $x_{r}$ 两点之间的距离，根据线性代数的知识，上式两边同时除以||w||有：
$\frac{w·(x_{p}-x_{r})}{||w||}=\frac{2}{||w||}$
而 $\frac{w·(x_{p}-x_{r})}{||w||}$ 就是两条虚线之间的距离d，所以有
$d=\frac{2}{||w||}$
       我们的目标是最大化d，那么只要最小化 $w||^2$ 即可。
       对于所有紫色的点，有y_i=1，w·x_i+b≥1；对于所有红色的点，有y_i=-1，w·x_i+b≤-1。
       所以，对所有的点，有y_i·(w·x_i+b)≥1.
       因此SVM求解的问题就转化为：
在这里插入图片描述
       根据拉格朗日函数及其对偶问题的相关知识，上述问题可以转化为

       求出α之后，就可求得w和b，则可得模型

2.核函数

       在第一节中，我们假设在当前空间中，这些样本是线性可分的，但有时存在线性不可分的情况；幸运的是，如果原始空间是有限维，即属性数是有限的，那么一定存在一个高维空间使样本线性可分。令Φ(x)表示将x映射到高维空间(称为新空间)后的特征向量，于是在新空间中，划分超平面所对应的模型可表示为
$f(x) = w^TΦ(x)+b$
       likewise:
在这里插入图片描述
       转化为对偶问题

       上式涉及到计算Φ(x_i)·Φ(x_j)，由于新空间的维数可能很高，甚至可能是无穷维，因此直接计算是非常困难的，我们使用“核技巧”来解决该问题：
$K (u, v) = Φ (u) \cdot Φ (v)$
       于是，上面的问题可以写为：
在这里插入图片描述
       求解后可得到

       sklearn中涉及到的核函数有：

3.软间隔

在第一节中，我们所举的样本点，恰好能被一个超平面完全分开，这时称这两类样本点之间存在“硬间隔”；然而，当两组数据几乎完全线性可分，但决策边界在训练集上存在较小的训练误差(比如下图中的红圈样本)，这时就成这两类样本点之间存在“软间隔”

在这里插入图片描述
       这些红圈点并不满足y_i·(w·x_i+b)≥1，即y_i·(w·x_i+b)＜1。但对于每个红圈点来说，若让决策超平面往上或者往下移动一点(每个点移动的距离不一样)，那么就能近似满足约束，即
$y_{i}·(w^Tx+b)≥1-ξ_i$
       那么我们就把 $ξ_i$ 视为决策超平面对于每个样本点能容忍的犯错程度，当然，在最大化间隔的时候，我们希望不满足约束(即犯错)的样本尽量少，因此优化目标可写为
在这里插入图片描述
       其中C为用来控制惩罚想的惩罚力度系数。C越大，越不能容忍错误样本点或者说对每个样本点能容忍的犯错程度越小，倾向于选择 $B_2$ ；C越小，能容忍更多的错误样本点或者说对每个样本点能容忍的犯错程度越大，倾向于选择 $B_1$ 。在这里插入图片描述

转化为对偶问题可得：
在这里插入图片描述

缦旋律

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SVM

1.SVM的基本问题在样本空间中，划分超平面(又称为决策边界)可以通过如下线性方程表示：wTx+b=0w^ Tx+b =0wTx+b=0决策边界位于两条虚线超平面的中间，对于位于虚线超平面上的点(称为支持向量)，有w⋅x+b=k,w⋅x+b=−kw·x+b=k,w·x+b=-kw⋅x+b=k,w⋅x+b=−k两个表达式同时除以k，则可以得到：w⋅x+b=1w⋅x+b=−1w·x+b=1 w·x+b=-1w⋅x+b=1w⋅x+b=−1以上就是两条虚线超平面的表达式，1和-1
复制链接

扫一扫

专栏目录