支持向量机SVM(1)-线性可分支持向量机

最新推荐文章于 2023-06-26 23:51:24 发布

「已注销」

最新推荐文章于 2023-06-26 23:51:24 发布

阅读量566

点赞数 1

分类专栏：统计机器学习文章标签： Machine Learning

本文链接：https://blog.csdn.net/xu_ampl/article/details/90055925

版权

线性可分支持向量机

本文包括以下部分

1.支持向量机概述
2.线性可分支持向量机与硬间隔最大化
- (2.1)基本定义
- (2.2)函数间隔与几何间隔的关系
- (2.3) 硬间隔最大化
- (2.4) 支持向量和间隔边界
3. 对偶算法

1.支持向量机概述

支持向量机是一种二类分类模型.它的基本模型是定义在特征空间上的间隔最大的线性分类器。其学习策略是间隔最大化，可形式化为求解凸二次规划问题，也等价于正则化的合叶损失函数的最小化问题。
支持向量机学习方法包含构建由简至繁的模型，可分为线性可分支持向量机、线性支持向量机、非线性支持向量机。

线性可分支持向量机：当训练数据线性可分时，通过硬间隔最大化，学习一个线性的分类器，又称为硬间隔支持向量机.
线性支持向量机：当训练数据近似线性可分时，通过软间隔最大化，也学习一个线性分类器，称为软间隔支持向量机.
非线性支持向量机：当训练数据不可分时，通过使用核技巧及软间隔最大化，学习非线性支持向量机.

当输入空间为欧氏空间或离散集合，特征空间为希尔伯特空间时，核函数表示将输入从输入空间映射得到特征空间之间的内积，通过使用核函数可以学习非线性支持向量机，等价于隐式地在高维的特征空间中学习线性支持向量机，这样的方法称为核技巧。核方法是比支持向量机更为一般的机器学习方法。
本文按照上式思路首先记录线性可分支持向量机

2.线性可分支持向量机与硬间隔最大化

(2.1)基本定义
输入都由输入空间转换到特征空间，支持向量机的学习是在特征空间进行的。
假设给第一个特征空间上的训练数据集 $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \cdots,\left(x_{N}, y_{N}\right)\right\}$ 其中 $x_{i} \in \mathcal{X}=\mathbf{R}^{n}, \quad y_{i} \in \mathcal{Y}=\{+1,-1\}, \quad i=1,2, \cdots, N$ , $x_i$ 为第 $i$ 个特征向量，也称为实例， $y_i$ 为 $x_i$ 的类标记，当 $y_i=+1$ 时，称 $x_i$ 为正例；当时 $y_i=-1$ ，称 $x_i$ 为负例， $x_{i}, y_{i})$ 称为样本点.再假设训练数据集是线性可分的.
定义1（线性可分支持向量机）给定线性可分训练数据集，通过间隔最大化或等价地求解相应的凸二次规划问题学习得到分离超平面为
$w^{*} \cdot x+b^{*}=0 \quad(1)$ 以及相应的分类决策函数 $f(x)=\operatorname{sign}\left(w^{*} \cdot x+b^{*}\right) \quad(2)$ 称为线性可分支持向量机
定义2 (函数间隔) 对于给定的训练数据集 $T$ 和超平面 $(w, b)$ ,定义超平面 $(w, b)$ 关于样本点 $x_{i}, y_{i})$ 的函数间隔为 $\hat{\gamma}_{i}=y_{i}\left(w \cdot x_{i}+b\right) \quad(3)$ 定义超平面 $(w, b)$ 关于训练数据集 $T$ 的函数间隔为超平面 $(w, b)$ 关于中所有样本点 $x_{i}, y_{i})$ 的函数间隔之最小值，即 $\hat{\gamma}=\min _{i=1, \cdots, N} \hat{\gamma}_{i} \quad(4)$ 定义3 (几何间隔) 对于给定的训练数据集 $T$ 和超平面 $(w, b)$ ,定义超平面 $(w, b)$ 关于样本点 $x_{i}, y_{i})$ 的几何间隔为
$\gamma_{i}=y_{i}\left(\frac{w}{\|w\|} \cdot x_{i}+\frac{b}{\|w\|}\right) \quad (5)$ 定义超平面 $(w, b)$ 关于训练数据集 $T$ 的函数间隔为超平面 $(w, b)$ 关于中所有样本点 $x_{i}, y_{i})$ 的几何间隔之最小值，即 $\gamma=\min _{i=1, \cdots, N} \gamma_{i} \quad(6)$ 下图为函数间隔与几何间隔示例:

上图给出了超平面 $(w, b)$ 及其法向量 $w$ ，点 $A$ 表示某一实例 $x_i$ ,其类标记 $y_i=+1$ ，点 $A$ 与超平面 $(w, b)$ 的距离由线段 $A B$ 给出，记作 $\gamma_i$ ,
$\gamma_{i}=\frac{w}{\|w\|} \cdot x_{i}+\frac{b}{\|w\|}$ 其中， $\|w\|$ 为 $w$ 的 $L_2$ 范数，这是点 $A$ 在超平面正的一侧的情形，若点 $A$ 在超平面负的一侧，那么有 $\gamma_{i}=-\left(\frac{w}{\|w\|} \cdot x_{i}+\frac{b}{\|w\|}\right)$ 当样本点 $x_{i}, y_{i})$ 被超平面 $(w, b)$ 正确分类时，点 $x_i$ 与超平面 $(w, b)$ 的距离是 $\gamma_{i}=y_i\left(\frac{w}{\|w\|} \cdot x_{i}+\frac{b}{\|w\|}\right)$

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
支持向量机SVM(1)-线性可分支持向量机

支持向量机-线性可分支持向量机支持向量机是一种二类分类模型.它的基本模型是定义在特征空间上的间隔最大的线性分类器。其学习策略是间隔最大化，可形式化为求解凸二次规划问题，也等价于正则化的合叶损失函数的最小化问题。支持向量机学习方法包含构建由简至繁的模型，可分为线性可分支持向量机、线性支持向量机、非线性支持向量机。线性可分支持向量机：当训练数据线性可分时，通过硬间隔最大化，学习一个线性的分类器...
复制链接

扫一扫