【机器学习笔记】支持向量机_ova支持向量机和multi hinge loss-CSDN博客

本文链接：https://blog.csdn.net/weixin_39782563/article/details/120550320

文章目录

1 SVM原理

个人学习笔记，参考B站《机器学习白板推导系列》课程、周志华《机器学习》、李航《统计学习方法》。

1 SVM原理

SVM有三宝，间隔、对偶、核技巧。

支持向量机：

硬间隔（hard-margin SVM）
软间隔（soft-margin SVM）
核函数（kernel SVM）

1.1 硬间隔分类器

1.1.1 最大间隔分类器

设定：

分类超平面为： $w^Tx + b = 0$

数据集： $\in \{(x_i,y_i)\}_{n=1}^{N}$

$x_i \in R^p，y \in \{-1,1\}$

硬间隔分类器，也称为“最大间隔分类器”，根据定义原问题可以写成：
$\begin{aligned} & \max_{w,b} margin(w, b) \\ & s.t. \begin{cases} w^Tx_i+b>0，y_i=+1 \\ w^Tx_i+b<0，y_i=-1 \end{cases} \end{aligned}$
margin为所有样本到超平面最小的距离。 定义 $m a r g i n (w, b)$ :
$margin(w,b)=\min_{w,b,x_i,i=1,2,\cdots,N} distance(w,b,x_i)$
distance为样本 $x_i$ 到超平面的距离。 定义点 $x_i$ 到超平面 $w^Tx+b$ 的距离 $distance(w,b,x_i)$ 为：
$distance(x,b,x_i)=\frac{|w^Tx_i+b|}{||w||}$

1.1.2 损失函数

整理上一节公式得到：
$\begin{aligned} & \max_{w,b} \min_{x_i} \frac{|w^Tx_i+b|}{||w||} \\ & =\max_{w,b} \frac{1}{||w||} \min_{x_i} |w^Tx_i+b| \\ & = \max_{w,b} \frac{1}{||w||} \min_{x_i} y_i(w^Tx_i+b) \\ & \because \ \ y_i(x^Tx_i+b)>0 \\ & \therefore \ \ \exists r>0，使 \min_{x_i} y_i(w^Tx_i+b)=r \\ & 令\ r=1，则 \min_{x_i} y_i(w^Tx_i+b)=1 \\ \end{aligned}$
即：
$\begin{aligned} & \begin{cases} \max_{w,b} {||w||}^{-1} \\ s.t. \ \ \ \min_{x_i} y_i(w^Tx_i+b)=1 \end{cases} \\ \\ & 转换形式： \\ \\ & \begin{cases} \min_{w,b} ||w|| \\ s.t. \ \ \ y_i(w^Tx_i+b) \ge 1 \end{cases} \end{aligned}$
最终得到 损失函数：