支持向量机的rbf函数到底是怎么算的？

最新推荐文章于 2023-09-26 21:21:05 发布

LiraWang

最新推荐文章于 2023-09-26 21:21:05 发布

阅读量1.3k

点赞数 2

分类专栏：零知识证明机器学习文章标签： python

本文链接：https://blog.csdn.net/weixin_38243001/article/details/119541539

版权

本文探讨了支持向量机中rbf核函数的计算问题，作者通过研究和实验，排除了多个猜想，最终得出结论：在核函数中使用的通常是支持向量。通过对训练好的模型进行预测验证，作者确认了这一观点，并展示了如何利用Python实现这一过程。

摘要由CSDN通过智能技术生成

最近在做机器学习相关的zkp工作，在处理支持向量机核函数时对一些具体细节产生了一些疑惑，查询了很多资料，并做实验得到了结论，在此记录一下（2021.8.9）

问题描述

在进行支持向量机分类时（svc），大部分问题都要使用核函数，而最常用的核函数时rbf核函数。根据sklearn的文档，rbf核函数的定义是：
在这里插入图片描述
可以看到，核函数的定义是计算两个输入向量x和y的距离，乘以某一个参数并求e的负指数幂。这里问题来了：假设我们已经持有一个训练好的模型，参数固定，且有一条训练数据x，那么此时，y是什么？

几个猜想

猜想1：由于函数中y的定义是None，一开始猜想y是0，或者是x本身。这两个猜想比较容易看出是错误的，被排除。
猜想2：看了许多知乎、csdn后，发现有人描述：“rbf核函数的思想有些像k-means聚类，将新样本分类到最近的样本中”。更有博客描述在径向基核函数中y是一个“landmark”(啊真不知为什么要这样讲，个人感觉很歧义呀)，因此猜测y会不会是在训练阶段固定下来的参数，像上式中的 $\gamma$ 一样。但有些地方又说“多数情况下取所有训练集作为landmark”。经过思考，认为不太可能把训练数据集直接嵌入到模型里，并且模型没有相应维度、或类似维度的输出，排除这个猜想。
猜想3：也单独考虑过训练集，或部分训练数据，同理排除。
猜想4：考虑过训练样本本身两两计算距离，然而哪怕只有一条数据也应该可以预测，因此排除。

结论

在排除了一堆错误答案，看了无数的博客，跟许多人讨论后，认为有很大可能这里的y是支持向量机的支持向量，即support vectors。同时在翻找资料时，找到这样一个帖子：
在这里插入图片描述
在这个回答中，我们可以看到博主提到，decision function是：
$\Sigma_{i\in SV}\alpha_ik(x, x_i)+b=y$
这里

最低0.47元/天解锁文章

LiraWang

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
支持向量机的rbf函数到底是怎么算的？

最近在做机器学习相关的zkp工作，在处理支持向量机核函数时对一些具体细节产生了一些疑惑，查询了很多资料，并做实验得到了结论，在此记录一下（2021.8.9）问题描述在进行支持向量机分类时（svc），大部分问题都要使用核函数，而最常用的核函数时rbf核函数。根据sklearn的文档，rbf核函数的定义是：可以看到，核函数的定义是计算两个输入向量x和y的距离，乘以某一个参数并求e的负指数幂。这里问题来了：假设我们已经持有一个训练好的模型，参数固定，且有一条训练数据x，那么此时，y是什么？几个猜想.
复制链接

扫一扫

专栏目录