西瓜书-支持向量机

最新推荐文章于 2023-04-04 11:01:22 发布

ZJoannaw

最新推荐文章于 2023-04-04 11:01:22 发布

阅读量761

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/zjw120/article/details/128395918

版权

支持向量机（SVM）是一种机器学习方法，核心思想是通过最大化间隔来构建决策边界。它涉及对偶问题、拉格朗日乘子法和SMO算法来寻找最优解。特征空间映射允许在高维空间中处理样本，而核函数则避免了直接计算高维内积的复杂性。SVM在处理分类问题时，通过设置松弛变量ξ来处理违反间隔的样本。其应用场景包括数据分类和预测，尤其适用于小样本和高维数据。

摘要由CSDN通过智能技术生成

支持向量机

支持向量:距离超平面最近的这几个训练样本点。

支持向量机的核心思想是最大化间隔 $\gamma = \frac{2}{||w||}$ 。
求极大转换为求极小，转化为凸规划问题。

对偶问题

利用拉格朗日乘子法，对于不等式约束，在其前加入一个乘子 $\alpha_i \ge 0$

支持向量机对偶问题得到的目标函数最优值是原始问题目标函数最优值的下界KKT条件说明，要么 $\alpha_i = 0$ 要么 $y_i \dot f(x_i)=1$ 。前者说明该点不会出现在解集内，即不符合约束；后者说明该点一定在支持向量上。因此，最终模型仅与支持向量有关。

求解方法—SMO

顺序性最小优化算法（sequential minimal optimization）

基本思路：按照KKT条件违背程度最大准则选取变量,固定一对变量 $\alpha_i$ 和 $\alpha_j$ ，对偶问题的约束为 $0=\sum_{i=1}^{m} \alpha_i y_i$ ，那么这对变量的和就固定了。接着用一个变量表示另一个变量，带入对偶问题的目标函数，求得闭式解。
循环重复1、2步骤，直至目标函数收敛。

特征空间映射

将样本空间映射为高维空间（这个高维可以是无穷维），即将x映射为 $\phi (x)$

此时内积可以用核函数表示，能绕过显式考虑特征映射，直接在原始的特征空间计算，缓解计算高维内积的困难。

核函数

Mercer定理可以从点到点的距离数学表达理解。由于核函数的初衷是表示空间中两点的距离，因此对于对称核矩阵有:

	Ki	Kj
Ki	(Ki,Ki)	(Ki,Kj)
Kj	(Kj,Ki)	(Kj,Kj)

若对称轴上每一项均大于等于0，那么Ki和Kj两点之间的距离大于等于0.

$dist(x_1,x_2)=\|\phi(x_1)-\phi(x_2)\|_{\mathcal{H}_k}^2=\sqrt{k(x_1,x_1)-2k(x_1,x_2)+k(x_2,x_2)}$

对于两个样本点(0,0),(1,1)，若我们将其投影到与高斯核函数
关联的RKHS中时，则两个样本投影后的点距离为1.315