统计学习方法第七章支持向量机读书笔记

辰明Xucy

已于 2022-11-28 16:27:22 修改

阅读量218

点赞数 2

文章标签：学习方法

于 2022-11-23 09:52:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50650660/article/details/127994514

版权

文章目录

第七章支持向量机

第七章支持向量机

支持向量机(support vector machines,SVM)是一种二分类模型

三要素

模型

定义在特征空间上的间隔最大的线性分类器，间隔最大使它有别于感知机。

策略

间隔最大化。可形式化为一个求解凸二次规划的问题，也等价于正则化的合页损失函数的最小化问题。

算法

求解凸二次规划的最优化算法

为什么叫支持向量机

在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z5uwmcCV-1669168163417)(https://gitee.com/imagebed_test/markdown_image/raw/master/img/202211161327396.png)]

7.1 线性可分支持向量机与硬间隔最大化

7.1.1 线性可分向量机

线性可分指的是可以完全分开，即超平面 $\omega·x+b=0$ 上没有样本点。

在这里插入图片描述

我们要使得最小几何间隔最大化

7.1.2函数间隔与几何间隔

定义

在这里插入图片描述

在这里插入图片描述

7.1.3 间隔最大化

凸优化问题指的是约束最优化问题

在这里插入图片描述

最大间隔分离超平面的存在与唯一性

**存在性：**由于训练数据中既有正类点又有负类点，所以（w，b）=（0，b）不是最优化的可行解，因此最优解必定满足w不等于0，由此可知分离超平面的存在性。

理解： $y(\omega·x+b)>0为正确分类，\omega=0时,y(\omega·x+b)-->yb$

$若 b > 0, 负类无法正确分类，反之正类无法正确分类$

在这里插入图片描述

在这里插入图片描述

算法 7.1 最大间隔算法

在这里插入图片描述

7.1.4 学习的对偶问题

在这里插入图片描述

在这里插入图片描述

算法7.2 线性可分支持向量机学习算法

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JNwXF4tM-1669168163422)(https://gitee.com/imagebed_test/markdown_image/raw/master/img/202211191557691.png)]

7.2 线性支持向量机与软间隔最大化

7.2.1 线性支持向量机

训练集： $T{(x_1,y_1),(x_2,y_2),···,(x_N,y_N)}$ 其中 $x_i\in\mathcal{X}=R^n,y_i\in\mathcal{Y}=\{+1,-1\}$

线性可分： $y_i(\omega·x_i+b)\geq1$

位于间隔区域内的点： $y_i(\omega·x_i+b)+\xi_i\geq1此时\xi_i\in(0,1)$

位于间隔边界外(相反方向): $y_i(\omega·x_i+b)+\xi_i\geq1此时\xi_i>1,\xi_i为松弛变量$

此时约束条件：
$KaTeX parse error: Can't use function '$' in math mode at position 2: $̲y_i(\omega·x_i+…$

此时目标函数为：
$\frac{1}{2}||\omega||+C\sum_{i=1}^{N}\xi_i$
C>0时称为惩罚参数，C值越大，对误分类惩罚越大，反之越小

此时优化问题：(凸二次规划问题)

在这里插入图片描述

在这里插入图片描述

7.2.2 原始问题与对偶问题

在这里插入图片描述

在这里插入图片描述

7.2.3 合页损失函数

在这里插入图片描述

在这里插入图片描述

7.3 非线性支持向量机与核函数

7.3.1 核技巧

非线性可分问题

不同于线性可分问题，存在一个超平面可使其分离，这里存在的是一个超曲面，称为非线性可分，同样的存在非线性不可分

在这里插入图片描述

在这里插入图片描述

核函数

在这里插入图片描述

映射 $\phi(x)$ 不唯一且维度也不唯一，但是他们对应的核函数相同

7.3.2 正定核

空间

在这里插入图片描述

正定核的充要条件

在这里插入图片描述

$K(x,z)是正定核\Leftrightarrow K是半正定矩阵$

7.3.3 常用核函数

在这里插入图片描述

3.定义在离散集合
$[\phi_n(s)]_u=\Sigma_{i:s(i)=u} \lambda^{l(i)}$

在这里插入图片描述

7.3.4 非线性支持向量机

在这里插入图片描述

7.4 优化算法

7.4.1 序列最优化算法

在这里插入图片描述

在这里插入图片描述

初始可行解为 $\alpha_1^o,\alpha_2^o,最优解为\alpha_1^n，\alpha_2^n$ 取值范围需要满足
$L\leq\alpha_2^n\leq H$
在这里插入图片描述

7.4.2 变量选择方法

1.第一个变量的选择

选择违反KKT条件最严重的样本点

2.第二个变量的选择

选择使 $E_1-E_2|$ 最大的 $\alpha_2$

3.b与 $E_i$ 计算

当 $0<\alpha_1^n<C$ 时
在这里插入图片描述

在这里插入图片描述

当 $0<\alpha_2^n<C$

在这里插入图片描述

在这里插入图片描述

7.4.3 SMO

在这里插入图片描述

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。