SVM3

最新推荐文章于 2021-12-01 23:12:30 发布

三少Algorithm

最新推荐文章于 2021-12-01 23:12:30 发布

阅读量265

点赞数

分类专栏：机器学习文章标签： svm

本文链接：https://blog.csdn.net/weixin_42717395/article/details/103405736

版权

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

4 非线性支持向量机与核函数

**4.1 非线性分类问题：**如下图所示，通过变换，将椭圆变为直线，非线性分类问题变为了线性分类问题

在这里插入图片描述

原空间为 $\mathcal{X} \subset \mathbf{R}^{2}, x=\left(x^{(1)}, x^{(2)}\right)^{\mathrm{T}} \in \mathcal{X}$ ，新空间为 $\mathcal{Z} \subset \mathbf{R}^{2}, z=\left(z^{(1)}, z^{(2)}\right)^{\mathrm{T}} \in \mathcal{Z}$ ，从原空间到新空间的变换（映射）为： $z=\phi(x)=\left(\left(x^{(1)}\right)^{2},\left(x^{(2)}\right)^{2}\right)^{\mathrm{T}}$

原空间的椭圆 $w_{1}\left(x^{(1)}\right)^{2}+w_{2}\left(x^{(2)}\right)^{2}+b=0$ ，变为新空间的直线 $w_{1} z^{(1)}+w_{2} z^{(2)}+b=0$ ，在新空间中线性可分

4.2 核技巧：设 $\mathcal{X}$ 是输入空间（欧氏空间 $\mathbf{R}^{n}$ 或者离散集合），对应于一个特征空间（希尔伯特空间 $\mathcal{H}$ ），如果存在一个 $\mathcal{X}$ 到 $\mathcal{H}$ 的映射： $\phi(x): \mathcal{X} \rightarrow \mathcal{H}$ ，使得所有的 $\in \mathcal{X}$ ，函数 $K (x, z)$ 满足条件： $z)=\phi(x) \cdot \phi(z)$ ，则称 $K (x, z)$ 为核函数， $\phi(x)$ 为映射函数，式中 $\phi(x) \cdot \phi(z)$ 为两者的内积

在学习和预测时只定义核函数 $K (x, z)$ ，不显式定义映射函数 $\phi$ ，直接计算 $K (x, z)$ 比较容易，通过 $\phi(x)$ 和 $\phi(z)$ 计算 $K (x, z)$ 并不容易。对于给定核函数 $K (x, z)$ ，特征空间 $\mathcal{H}$ 和映射函数 $\phi(x)$ 的取法不唯一

将支持向量机对偶问题目标函数中的内积 $x_{i} \cdot x_{j}$ 替换为核函数 $K\left(x_{i}, x_{j}\right)=\phi\left(x_{i}\right) \cdot \phi\left(x_{j}\right)$ ，新的目标函数为：
$W(\alpha)=\frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_{i} \alpha_{j} y_{i} y_{j} K\left(x_{i}, x_{j}\right)-\sum_{i=1}^{N} \alpha_{i}$
新的分类决策函数为：
$f(x)=\operatorname{sign}\left(\sum_{i=1}^{N_{s}} a_{i}^{*} y_{i} \phi\left(x_{i}\right) \cdot \phi(x)+b^{*}\right)=\operatorname{sign}\left(\sum_{i=1}^{N_{s}} a_{i}^{*} y_{i} K\left(x_{i}, x\right)+b^{*}\right)$
这样，不需显式定义特征空间和映射函数，隐式地在特征空间中学习；通过线性分类器学习和核函数解决非线性问题

核函数是正定核函数，正定核函数的定义是：设 $\mathcal{X} \subset \mathbf{R}^{n}$ ， $K (x, z)$ 是定义在 $\mathcal{X} \times \mathcal{X}$ 上的对称函数，如果对任意 $x_{i} \in \mathcal{X}$ ， $\cdots, m$ ， $K (x, z)$ 对应的Gram矩阵：
$K=\left[K\left(x_{i}, x_{j}\right)\right]_{m \times m}$
是半正定矩阵，则称 $K (x, z)$ 是正定核

常用核函数：

多项式核函数：
$\cdot z+1)^{p}\\ f(x)=\operatorname{sign}\left(\sum_{i=1}^{N_{i}} a_{i}^{*} y_{i}\left(x_{i} \cdot x+1\right)^{p}+b^{*}\right)$
高斯核函数：
$z)=\exp \left(-\frac{\|x-z\|^{2}}{2 \sigma^{2}}\right)\\ f(x)=\operatorname{sign}\left(\sum_{i=1}^{N_{i}} a_{i}^{*} y_{i} \exp \left(-\frac{\|x-z\|^{2}}{2 \sigma^{2}}\right)+b^{*}\right)$
字符串核函数：
$k_{n}(s, t)=\sum_{u \in \Sigma^{n}}\left[\phi_{n}(s)\right]_{u}\left[\phi_{n}(t)\right]_{u}=\sum_{u \in \Sigma^{n}}\sum_{(i, j): s(i)=t(j)=u} \lambda^{l(i)} \lambda^{l(j)}$
给出了字符串 $s$ 和 $t$ 中长度等于 $n$ 的所有子串组成的特征向量的余弦相似度。直觉上，相同的子串越多，越相似，字符串核函数值越大。

4.3 非线性支持向量机学习算法：

输入： $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \cdots,\left(x_{N}, y_{N}\right)\right\}$ ，其中 $x_{i} \in \mathcal{X}=\mathbf{R}^{n},y_{i} \in \mathcal{Y}=\{+1,-1\}$ ， $\cdots, N$ ， $x_i$ 是第 $i$ 个特征向量，也称为实例， $y_i$ 为 $x_i$ 的类别标记

**输出：**分类决策函数

选取适当的核函数 $K (x, z)$ 和适当的参数 $C$ ，构造并求解最优化问题：
$\begin{array}{ll}{\min _{\alpha}} & {\frac{1}{2} \sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_{i} \alpha_{j} y_{i} y_{j} K\left(x_{i}, x_{j}\right)-\sum_{i=1}^{N} \alpha_{i}} \\ {\text { s.t. }} & {\sum_{i=1}^{N} \alpha_{i} y_{i}=0} \\ {} & {0 \leqslant \alpha_{i} \leqslant C, \quad i=1,2, \cdots, N}\end{array}$
求得最优解： $\alpha^{*}=\left(\alpha_{1}^{*}, \alpha_{2}^{*}, \cdots, \alpha_{N}^{*}\right)^{\mathrm{T}}$
选择 $\alpha^{*}$ 的一个正向量 $0<\alpha_{j}^{*}<C$ ，计算 $b^{*}=y_{j}-\sum_{i=l}^{N} \alpha_{i}^{*} y_{i} K\left(x_{i} \cdot x_{j}\right)$
构造决策函数： $f(x)=\operatorname{sign}\left(\sum_{i=1}^{N} \alpha_{i}^{*} y_{i} K\left(x \cdot x_{i}\right)+b^{*}\right)$

当 $K (x, z)$ 是正定核函数时，待求解的最优化问题为凸二次规划问题，解存在

三少Algorithm

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SVM3

4 非线性支持向量机与核函数**4.1 非线性分类问题：**如下图所示，通过变换，将椭圆变为直线，非线性分类问题变为了线性分类问题原空间为X⊂R2,x=(x(1),x(2))T∈X\mathcal{X} \subset \mathbf{R}^{2}, x=\left(x^{(1)}, x^{(2)}\right)^{\mathrm{T}} \in \mathcal{X}X⊂R2,x=(x(1...
复制链接

扫一扫