核PCA与增量PCA

最新推荐文章于 2022-02-06 19:43:01 发布

lisenpy

最新推荐文章于 2022-02-06 19:43:01 发布

阅读量339

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/lisenby/article/details/117410547

版权

笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

高斯核还没弄清楚，先马一下。
按我理解高斯核主要是用来处理非线性数据集，

解决非线性问题的另一种技术是添加相似特征，这些特征经过相似函数计算得出，相似函数可以测量每个实例与一个特定地标之间的相似度。以前面提到过的一维数据集为例，在x1=-2和x1=1处添加两个地标（见图5-8中的左图）。接下来，我们采用高斯径向基函数（RBF）作为相似函数

在这里插入图片描述
这是一个从0（离地标差得非常远）到1（跟地标一样）变化的钟形函数。现在我们准备计算新特征。例如，我们看实例x1=-1：它与第一个地标的距离为1，与第二个地标的距离为2。因此它的新特征为x2=eps（-0.3×12）≈0.74，x3=eps（-0.3×22）≈0.30。图5-8的右图显示了转换后的数据集（去除了原始特征），现在你可以看出，数据呈线性可分离了。

5-8
与多项式特征方法一样，相似特征法也可以用任意机器学习算法，但是要计算出所有附加特征，其计算代价可能非常昂贵，尤其是对大型训练集来说。然而，核技巧再一次施展了它的SVM魔术：它能够产生的结果就跟添加了许多相似特征一样（但实际上也并不需要添加）。
在sklearn的SVC模型中，由超参数gamma（γ）和C控制模型复杂度，增加gamma值会使钟形曲线变得更窄，因此每个实例的影响范围随之变小：决策边界变得更不规则，开始围着单个实例绕弯。反过来，减小gamma值使钟形曲线变得更宽，因而每个实例的影响范围增大，决策边界变得更平坦。所以γ就像是一个正则化的超参数：模型过拟合，就降低它的值，如果欠拟合则提升它的值。与C超参数类似。

lisenpy

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
核PCA与增量PCA

KS曲线是两条线，其横轴是“阈值”（区间序号，按概率排序的等份），纵轴是TPR（上面那条）与FPR（下面那条）的值，值范围[0，1] 。两条曲线之间之间相距最远的地方对应的阈值，就是最能划分模型的阈值。...
复制链接

扫一扫

专栏目录