机器学习笔记6

最新推荐文章于 2024-07-21 22:04:22 发布

Taylor Wu

最新推荐文章于 2024-07-21 22:04:22 发布

阅读量440

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WuSnake123/article/details/59700427

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

核函数

在节中，我们的SVM分类器可以实现分类了

对于一个新的样本x，我们只需要计算这个新样本与训练集的內积即可，而且只会计算支持向量的內积，因为其他向量的=0。

实际上，对于一个线性不可分样本集，我们一般做法是将其映射到更高甚至无限高的维度空间，来在高维情况下进行SVM分类

例如

这时，我们用代替x即可。并令其中即被称为核函数

假设这里写图片描述，

可以写成，
以n=3为例，

可以看出没有核函数，计算复杂度为，利用核函数只有

直观上来说，如果这里写图片描述和很近，我们可能认为很大，相反，如果很远–几近正交，则很小. 因此，我们可以认为可以看作是和相似度的一种测量. 例如，或许选择，，这是一种合理的测量方法，当x和z很近时值接近于1，很远时值接近0. 在特定的例子中是可以作为SVM的核的. （这个核叫做高斯核 Gaussian kernel,映射到一个无限维的特征）

还有一种常用的核函数是

定理（Mercer）:给定K，这里写图片描述是给定的，对于一个确定的核，它的充分必要条件是相应的核矩阵式对称半正定的.

实际上核函数是一个比SVM更广泛的概念，只有遇到內积形式，都可以转换为核函数，从而在高维解决低维不可分问题。

软边界

正则化和不可分的例子（regularization and the non-separable case）
到目前为止，我们讨论SVM时认为数据是线性可分的, 把数据映射到高维空间一般会增加线性可分的可能性，但是我们不能保证一定可以.

左图显示的是一个最优间隔分类器，但是如果在左上区域加上一个异常值，决定边界线会发生剧烈的变化，
导致分类器有更小的边界.
这里写图片描述

为了使算法能够处理非线性可分的数据集并且对异常值不会这么敏感, 修订优化问题如下，加了一个正则化因子：
这里写图片描述

因此，样本现在允许边界小于1.

其对偶问题为：

而且我们可以得出：

SMO算法

SMO = sequential minimal optimization

坐标上升（Coordinate ascend）
对于没有限制的优化问题：
这里写图片描述，除了用梯度上升和牛顿方法，还能使用坐标上升算法：

下图是坐标上升执行的一个过程：

但是我们现在解决的问题是有约束的

这是我们要解决的对偶问题：
这里写图片描述

这里不能直接使用坐标上升算法，因此（19）的限制. 因此我们至少要同时改变两个才能满足限制. 因此：
这里写图片描述

SMO算法之所以高效是能够很高效的计算出ai,aj.

以改变a1,a2为例，这里写图片描述（）所以

带入到W中，我们得到W关于一个二次函数，很容易求得的最优值

a1、a2的限制如下图所示：
这里写图片描述
得到：

之后计算出a1的值.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记6

核函数在节中，我们的SVM分类器可以实现分类了对于一个新的样本x，我们只需要计算这个新样本与训练集的內积即可，而且只会计算支持向量的內积，因为其他向量的=0。实际上，对于一个线性不可分样本集，我们一般做法是将其映射到更高甚至无限高的维度空间，来在高维情况下进行SVM分类例如这时，我们用代替x即可。并令其中即被称为核函数假设，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。