支持向量机基础之核函数

最新推荐文章于 2024-07-02 22:55:56 发布

hukai7190

最新推荐文章于 2024-07-02 22:55:56 发布

阅读量1.7k

点赞数 1

分类专栏：机器学习与神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hanging_Gardens/article/details/53176893

版权

机器学习与神经网络专栏收录该内容

2 篇文章 0 订阅

订阅专栏

学习笔记来自《知识发现》—史忠植

核函数

常用的核函数主要有： $\color{blue}{多项式核函数、径向基函数、多层感知机、动态核函数等。}$

多项式核函数

多项式函数

K (x, x i) = [(x, x i) + 1] d (1)

$K(x,x_i)=[(x,x_i)+1]^d \tag{1}$ 可得到

d $d$ 阶多项式分类器

f (x, α) = s i g n (\sum s u p p o r t v e c t o r y i α i [(x i \cdot x) + 1] d - b)

$f(x,\alpha)=sign(\operatorname*\sum_{support vector} y_i\alpha_i[(x_i \cdot x)+1]^d - b)$

径向基函数

经典的方法，判定规则

f (x) = s i g n (\sum i = 1 l α i K γ (| x - x i |) - b) (2)

$f(x)=sign(\sum_{i=1}^l \alpha_iK_{\gamma}(\vert x-x_i \vert)-b) \tag{2}$ 其中，

Kγ(|x−xi|) $K_{\gamma}(\vert x-x_i \vert)$ 取决于两个向量之间的距离

|x−xi| $\vert x-x_i \vert$ .对于任意

γ $\gamma$ ，函数

Kγ(|x−xi|) $K_{\gamma}(\vert x-x_i \vert)$ 是一个肺腑的单调函数。当样本数趋于无穷时它趋于0，最通用的判定规则是采用高斯函数

K γ (| x - x i |) = e x p {- | x - x i | σ 2} (3)

$K_{\gamma}(\vert x-x_i \vert) = exp\{{-{\vert x-x_i \vert} \over \sigma^2}\} \tag{3}$ 构造式(2)的判定规则必须估计：

参数 $\gamma$ 的值
中心点 $x_i$ 数目 $N$
描述中心点向量 $x_i$
参数 $\alpha_i$ 的值

与传统的的径向基函数方法的区别：这里每个径向基函数的中心点对应一个支持向量，中心点本身和输出权值都是由SVM训练算法来自动确定的。

多层感知机

采用 sigmoid 函数作为内积，实现了包含一个隐层的多层感知机，隐层节点数目由算法自动确定，满足Mercer条件的 Sigmoid 核函数为

K (x i, x j) = t a n h (γ x T i x j - Θ) (4)

$K(x_i,x_j)=tanh(\gamma x_i^Tx_j-\Theta) \tag{4}$

动态核函数

Amari和Wu通过对核函数的黎曼几何分析，提出利用实验数据逐步修正原有核函数，以更好的适应实际问题。设特征映射 $U=\Phi(x)$ ,则

d U = \sum i \partial \partial x i Φ (x) d x i

$dU=\sum_i{{\partial \over \partial x_i}\Phi(x)dx_i}$

∥ d U ∥ 2 = \sum i, j g i j (x) d x i d x j

$\Vert dU \Vert^2=\sum_{i,j}g_{ij}(x)dx_idx_j$
其中

gij(x)=(∂∂xiΦ(x))⋅(∂∂xjΦ(x)) $g_{ij}(x)=({\partial \over \partial x_i}\Phi(x))\cdot ({\partial \over \partial x_j}\Phi(x))$ ,非负定阵

(gij(x)) $(g_{ij}(x))$ 为

Rn $R^n$ 上的黎曼张量，

ds2=∑ijgij(x)dxidxj $ds^2 = \sum_{ij}g_{ij}(x)dx_idx_j$ 为

Rn $R^n$ 上的黎曼距离。黎曼空间，体积

d v = g (x) - - - - \sqrt d x 1 . . . d x n

$dv=\sqrt{g(x)}dx_1...dx_n$ ,并有

g(x)=det(gij(x)) $g(x)=det(g_{ij}(x))$ ,

g(x) $g(x)$ (放大因子)反映了特征空间中点

Φ(x) $\Phi(x)$ 附近局部区域被放大的程度。
因为

k(x,z)=(Φ(x)⋅Φ(z)) $k(x,z)=(\Phi(x) \cdot \Phi(z))$ ,可证

g i j (x) = \partial \partial x i \partial z i k (x, z) ∣ z = x

$g_{ij}(x)={\partial \over \partial x_i\partial z_i}k(x,z)\mid_{z=x}$ 特别对高斯函数

k(x,z)=exp{|x−z|22σ2},gij(x)=1σ2δij $k(x,z)=exp\{{\vert x-z \vert^2 \over {2\sigma^2}}\},g_{ij}(x)={1 \over \sigma^2}\delta_{ij}$ .
为有效地将两类不同的模式区别开来，并希望尽量拉大它们之间的距离，即尽量放大分离曲面附近的局部区域，可用修正核函数的办法到达此目的，设

c(x) $c(x)$ 是正的可微实函数，

k(x,z) $k(x,z)$ 是高斯核，则

k ˜ (x, z) = c (x) k (x, z) c (z) (5)

$\widetilde k(x,z)=c(x)k(x,z)c(z) \tag{5}$ 也是核函数，且

g ˜ i j (x) = c i (x) c j (x) + c 2 (x) g i j

$\widetilde g_{ij}(x)=c_i(x)c_j(x)+c^2(x)g_{ij}$ 其中

ci(x)=∂∂xic(x) $c_i(x)={\partial \over \partial x_i}c(x)$ .Amari和Wu设

c(x) $c(x)$ 有如下形式

c (x) = \sum x i \in S V h i e ∥ x - x i ∥ 2 2 τ 2 (6)

$c(x)=\sum_{x_i \in {SV}}h_ie^{{\Vert x-x_i\Vert}^2 \over {2\tau^2}} \tag{6}$ 其中，

τ>0 $\tau \gt0$ 是参数，

hi $h_i$ 是权系数。在支持向量

xi $x_i$ 附近有，

g ˜ (x) - - - - \sqrt \approx h i σ n e n r 2 2 τ 2 1 + σ 2 τ 4 γ 2 - - - - - - - - \sqrt

$\sqrt{\widetilde g(x)} \approx {h_i \over \sigma^n}e^{nr^2 \over {2\tau^2}} \sqrt{1+{\sigma^2 \over \tau^4}\gamma^2}$ 其中，

τ=|x−xi| $\tau=\vert x-x_i\vert$ 是欧式距离，为保证

g˜(x)−−−−√ $\sqrt{\widetilde g(x)}$ 在

xi $x_i$ 附近取最大值，同时在其他区域取较小值，计算有

τ \approx σ n \sqrt (7)

$\tau \approx {\sigma \over \sqrt{n}} \tag{7}$ 那么，新的训练过程由两步组成：

先用某个核k(高斯核)进行训练，然后按照式(5)、(6)、(7)得到修正的核 $\widetilde k$
用 $\widetilde k$ 进行训练

这种改进的训练方法可明显的降低错误识别率，还可以减少支持下向量的个数，从而提高识别速度。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。