Python机器学习：SVM007高斯核函数

最新推荐文章于 2024-09-12 16:04:00 发布

范德彪陕西分彪

最新推荐文章于 2024-09-12 16:04:00 发布

阅读量2.4k

点赞数 1

分类专栏： Python机器学习

本文链接：https://blog.csdn.net/weixin_46815330/article/details/111589565

版权

Python机器学习专栏收录该内容

73 篇文章 3 订阅

订阅专栏

在这里插入图片描述
径向基/RBF/高斯核都是这种形式

为了感性理解，模拟一下。。。过程

高斯核本质
l1 l2 两个地标

在这里插入图片描述
显然这样就线性可分了

我们只去了地标点l1 l2
高斯核去了len(x)个地标点

`本质是将原本数据，映射到一个无穷维空间（样本理论上有无穷多个）计算开销特别大~~~~~~ 有些应用适合初始样本数据样本维度高数量却不多 m < n 通常就是自然语言处理领域构建高维特征空间，然而样本的数量不多。`

遗留问题
γ作用是什么？
通过代码直观理解

#直观理解高斯核函数
import numpy as np
import matplotlib.pyplot as plt

x = np.arange(-4,5,1)
x

array([-4, -3, -2, -1,  0,  1,  2,  3,  4])

y =  np.array((x >= -2) & (x <= 2),dtype= 'int')
y

array([0, 0, 1, 1, 1, 1, 1, 0, 0])

x > -2

array([False, False, False,  True,  True,  True,  True,  True,  True])

x < 2

array([ True,  True,  True,  True,  True,  True, False, False, False])

plt.scatter(x[y == 0],[0] * len(x[y == 0]))
plt.scatter(x[y == 1],[0] * len(x[y == 1]))

在这里插入图片描述

使用高斯核函数将数据映射到二维

#使用高斯核函数将数据映射到二维
def gaussian(x,l):
    gamma = 1.0
    return np.exp(-gamma * (x - l ) ** 2)

l1, l2 = -1,1

X_new = np.empty((len(x),2))

for i,data in enumerate(x):
    X_new[i , 0] = gaussian(data , l1)
    X_new[i , 1] = gaussian(data , l2)
print(X_new)

[[1.23409804e-04 1.38879439e-11]
 [1.83156389e-02 1.12535175e-07]
 [3.67879441e-01 1.23409804e-04]
 [1.00000000e+00 1.83156389e-02]
 [3.67879441e-01 3.67879441e-01]
 [1.83156389e-02 1.00000000e+00]
 [1.23409804e-04 3.67879441e-01]
 [1.12535175e-07 1.83156389e-02]
 [1.38879439e-11 1.23409804e-04]]

plt.scatter(X_new[y == 0,0],X_new[y == 0,1])
plt.scatter(X_new[y == 1,0],X_new[y == 1,1])

在这里插入图片描述

范德彪陕西分彪

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python机器学习：SVM007高斯核函数

本质是将原本数据，映射到一个无穷维空间（样本理论上有无穷多个） 计算开销特别大~~~~~~ 有些应用适合 初始样本数据样本维度高 数量却不多 m < n 通常 就是自然语言处理领域 构建高维特征空间，然而样本的数量不多。

使用高斯核函数将数据映射到二维

`本质是将原本数据，映射到一个无穷维空间（样本理论上有无穷多个）计算开销特别大~~~~~~ 有些应用适合初始样本数据样本维度高数量却不多 m < n 通常就是自然语言处理领域构建高维特征空间，然而样本的数量不多。`