kernels SVM

最新推荐文章于 2022-04-29 20:56:29 发布

彼得·伊里奇·柴可夫斯基

最新推荐文章于 2022-04-29 20:56:29 发布

阅读量105

点赞数

分类专栏：笔记机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_45536936/article/details/118900596

版权

笔记同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

机器学习

7 篇文章 2 订阅

订阅专栏

在这里插入图片描述

目标：拟合非线性边界
想法：拟合复杂多项式
$\begin{cases} y\,\,=\theta _0+\theta _1f_1+\theta _2f_2+\theta _3f_3+\theta _4f_4\\ f_1=x_1, f_2=x_2,f_3=x_1x_2,d_4=x_{4}^{2}\\ \end{cases}$

事实上，f1、f2、f3被表示得太复杂了，我们可以在不改变他们功能的前提下换个方式来表示他们（换个数学工具）

手动选取三个特征点，(x0为截距1，直接忽略），分别为 $l^{\left( 1 \right)}\text{、}l^{\left( 2 \right)}\text{、}l^{\left( 3 \right)}$

每个l可以这么表示，举个例子：
$f_1=similarity\left( x,l^{\left( 1 \right)} \right) =\exp \left( -\frac{\left\| x-l^{\left( 1 \right)} \right\|}{2\sigma ^2} \right)$
注： $\left\| x \right\| \,\,\text{欧氏距离}$
similarity函数就是高斯kernel函数
注：这个函数与正态分布没什么实际上的关系，只是看上去像而已。

对kernel函数的介绍

对于
$f_1=similarity\left( x,l^{\left( 1 \right)} \right) =\exp \left( -\frac{\left\| x-l^{\left( 1 \right)} \right\|}{2\sigma ^2} \right)$
假设x接近 $l^{\left( 1 \right)}$ ，那么这个函数会接近于1
反着来想，函数会接近于0

假设
在这里插入图片描述
如果l1为[3 5]，那么当x也为[3 5]时，f1才为1，否则离1的值会原来越远。
$\sigma ^2\text{会影响}f\text{值的变化（移动）}$

划定边界

$\begin{cases} \text{设}y=\theta _0+\theta _1f_1+\theta _2f_2+\theta _3f_3\\ \theta _0=-0.5,\theta _1=1,\theta _2=1,\theta _3=0\\ \end{cases}$
我们随机在图像上取一点（图中洋红色点）
在这里插入图片描述

在这里插入图片描述
通过设置 $\theta$ 就可以确定分类的边界（图中红圈）

选取特征点 $l^{\left( i \right)}$

直径从训练集里面选定样本点
我们通常是根据训练集的数量选择地标的数量，即如果训练集中有𝑚个实例，则我们选取 𝑚个地标，并且令𝑙(1)=𝑥(1),𝑙(2)=𝑥(2),…,𝑙(𝑚)=𝑥(𝑚)。这样做的好处在于：现在我们得到的新特征是建立在原有特征与训练集中所有其他特征之间距离的基础之上的，即（给定x）：
在这里插入图片描述
算好了f之后，带入测试集，当 𝜃^𝑇𝑓>=0 时，预测 𝑦=1
Σ𝜃𝑗²=𝜃^𝑇𝜃
我们还需要对最后的正则化项进行些微调整，在计算∑𝜃² = 𝜃^𝑇𝜃时，我们用𝜃^𝑇𝑀𝜃代替,其中𝑀是根据我们选择的核函数而不同的一个矩阵。这样做的原因是为了简化计算。
下面是支持向量机的两个参数
𝐶和 𝜎的影响：
在这里插入图片描述