【论文精读】SVM for Clustering

最新推荐文章于 2021-09-09 16:03:58 发布

Atlas8346

最新推荐文章于 2021-09-09 16:03:58 发布

阅读量2.8k

点赞数 1

本文链接：https://blog.csdn.net/qq_25011449/article/details/80641087

版权

A Support Vector Method for Clustering

原文地址：A Support Vector Method for Clustering

本文介绍了一种基于SVM的聚类方法，核心思想是用高斯核的SVM找到多个能够包围数据的半径最小的超球。使用此方法不用预先确定类别的结构和个数。

Abstract

聚类问题可以用参数化或非参数化的方法处理。参数化方法往往限制于其表达能力（expressive power），即需要预先猜想类别的结构（概率分布）。这篇文章提出一种非参数化的基于SV的方法用来描述高维分布的特性，首先找到一个最小半径的能够包围所有数据的超球，通过减小高斯核的方差（the width parameter of the Gaussian kernel function），可以使超球分类成很多的小部分，每一小部分中包含的点便是一种类别。用软间隔解决异常值问题从而处理不同类别重叠的问题。

Describing Cluster Boundaries with Support Vectors

共有 $N$ 个数据点 $\{x_i\} \subseteq \chi$ ， $\chi \subseteq \mathbb{R}^d$ ， $\Phi$ 是 $\chi$ 变换至高维的特征，加入松弛变量 $\xi _j$ ，要想求得包围所有数据的最小半径的超球，可用下面的问题描述：

m i n R 2 + C Σ ξ j s . t . ∥ Φ (x j) - a ∥ 2 \leq R 2 + ξ j, ξ j \geq 0, \forall j

$min~R^2+C\Sigma \xi _j \\ s.t.~\left \| \Phi {(x_j)-a} \right \|^2\leq R^2+ \xi _j, \\ \xi _j\geq 0,\forall j$

其中 $R$ 为半径， $a$ 为超求的球心，拉格朗日函数：

L = R 2 - Σ (R 2 + ξ j - ∥ Φ (x j) - a ∥ 2) β j - Σ ξ j μ j + C Σ ξ j,

$L=R^2-\Sigma(R^2+\xi _j-\left \| \Phi {(x_j)-a} \right \|^2) \beta_j- \Sigma \xi _j \mu_j+C\Sigma \xi _j,$

其中拉格朗日乘子 $\beta_j \geq0 ,\mu_j \geq 0$ ， $C$ 为惩罚参数。对 $R,a,\xi_j$ 分别求偏导并置零得：

Σ β j = 1, a = Σ β j Φ (x j), β j = C - μ j

$\Sigma \beta _j=1,\\a=\Sigma \beta _j\Phi(x_j),\\ \beta _j=C-\mu_j$

KKT条件：

ξ j μ j = 0, (R 2 + ξ j - ∥ Φ (x j) - a ∥ 2) β j) = 0

$\xi _j\mu_j=0,\\(R^2+\xi _j-\left \| \Phi {(x_j)-a} \right \|^2) \beta_j)=0$

对于样本点 $x_i$ ：

若 $\xi _i >0$ 则样本点在超球外；
若 ξi=0 则样本点在超球面上或超球面内，当 βi≠0 ：
- 若 $0<\beta_i<C$ 则称样本点是一个支持向量（SV）；
- 若 $\beta_i =C$ 则称样本点为边界支持向量（bounded SV）

接下来拉格朗日对偶函数：

W = Σ j Φ (x j) 2 β j - Σ i, j β i β j Φ (x i) \cdot Φ (x j)

$W=\Sigma_j \Phi(x_j)^2\beta_j-\Sigma_{i,j}\beta_i\beta_j\Phi(x_i) \cdot \Phi(x_j)$

将上述推导出的条件代入可得约束条件变为：

0 \leq β j \leq C

$0\leq\beta_j\leq C$

将内积运算全部换成如下的高斯核：

K (x i, x j) = e - q ∥ x i - x j ∥ 2,

$K(x_i,x_j)=e^{-q\left \| x_i-x_j \right \|^2},$

$q$ 为宽度参数（width parameter，即 $\frac{1}{2\sigma ^2}$ ），那么拉格朗日对偶函数可写为：

W = Σ j K (x j, x j) β j - Σ i, j β i β j K (x i, x j) 。

$W=\Sigma_j K(x_j,x_j)\beta_j-\Sigma_{i,j}\beta_i\beta_jK(x_i,x_j)。$

此时数据点到球心的距离：

R 2 (x) = ∥ Φ (x j) - a ∥ 2

$R^2(x)=\left \| \Phi {(x_j)-a} \right \|^2$

可化为：

R 2 (x) = K (x, x) - 2 Σ j β j K (x j, x) + Σ i, j β i β j K (x i, x j)

$R^2(x)=K(x,x)-2\Sigma_j \beta_jK(x_j,x)+\Sigma_{i,j}\beta_i\beta_jK(x_i,x_j)$

那么超球的半径即为SV到球心的距离。此时闭合轮廓的形状由参数 $q$ 和 $C$ 决定。如下图， $q$ 增大，轮廓就越贴合样本点。 $q$ 主要定义了单个样本对整个分类超平面的影响，当 $q$ 比较小时，单个样本对整个分类超平面的影响比较小，不容易被选择为支持向量，反之，当 $q$ 比较大时，单个样本对整个分类超平面的影响比较大，更容易被选择为支持向量，或者说整个模型的支持向量也会多。

而当 $C$ 减小时，如下图，轮廓边缘变得平滑，SV的数量减少，而bounded SV的数量增多（当 $C<1$ 时bounded SV才会存在），可以更好地处理异常点。如果把惩罚系数 $C$ 和RBF核函数的系数 $q$ 一起看，当 $C$ 比较大， $q$ 比较大时，我们会有更多的支持向量，我们的模型会比较复杂，容易过拟合一些。如果 $C$ 比较小， $q$ 比较小时，模型会变得简单，支持向量的个数会少。

Support Vector Clustering (SVC)

为了将数据点聚类，文中介绍了一种求两点间邻接矩阵的方法：

如果两点连线间的所有点均在超球内部，说明两数据点有连接，即位于同一类。

Overlapping clusters（不是很懂）

当存在重叠时，说明bounded SV很多，SVC可以近似地看作Parzen窗概率密度估计（如下公式）。

$p (x) = 1 N Σ i K (x i, x)$ $p(x)=\frac {1}{N} \Sigma_iK(x_i,x)$

Parzen窗概率密度估计值最大的点便是核心的点。

The iris data

在鸢尾花数据集的数值实验中，SVC表现要优于information theoretic approach和SPC algorithm这两个非参数化的聚类方法。具体实验结果如下：

同时，需要注意的是，SVC在低维特征上的表现要优于高维特征，因此最好事先对数据特征进行降维处理，例如PCA。

Varying $q$ and $C$

这里将如何寻找最优的 $q$ 和 $C$ ，对于 $q$ 最好从小到大依次寻找，因为一个比较好的聚类通常含有较少的类别。当SV的数量超出某个范时便可确定参数 $q$ 和 C <script type="math/tex" id="MathJax-Element-72">C</script>。

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

Atlas8346

关注关注

1
点赞

踩

14

收藏

觉得还不错? 一键收藏

2
评论

分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫

举报

举报

【StyleGAN论文精读CVPR_2019】A Style-Based Generator Architecture for Generative Adversarial Networks

zik的博客

08-05 931

【Paper】> PyTorch版【Code】> 官方TensorFlow版【Code】本篇博客是StyleGAN原始论文的中文版精读，帮助全面深入理解StyleGAN。首先StyleGAN灵感来自style transfer literature。改进是基于Progressive GAN(ABCDEFStyle mixing见3.1节。加噪声添加随机性见3.2节。

论文精读——基于机器学习的越南生活固体废弃物预测

m0_47267927的博客

01-21 1674

论文解读——基于机器学习的越南生活固体废弃物预测本研究旨在通过比较六种基于机器学习的模型来预测越南生活固体废弃物。

2 条评论您还未登录，请先登录后发表或查看评论

svm经典论文

超越梦想的专栏

05-11 1万+

1. P. H. Chen, C. J. Lin, and B. Schölkopf, A tutorial on ν-support vector machines, Appl. Stoch. Models. Bus. Ind. 2005, 21, 111-136. 2. A. J. Smola and B. Schölkopf, A tutorial on support vector r

深入浅出SVM（支持向量机）

lost-person的博客

02-10 8357

支持向量机是机器学习领域中经典的分类算法之一，最早由Corinna Cortes, Vladimir Vapnik于1995年提出。对原论文感兴趣的读者可下载此论文Support-Vector Network 简介分类学习的最基本思想就是基于给定的训练集DDD，在样本空间中寻找一个划分超平面，将不同类别的样本分开。假如有一样本集D={(x1,y1),(x2,y2),…,(xm,ym)}D = ...

首次提出SVM的英文论文，105页pdf

11-16

首次提出SVM；英文版，印刷清除；内容详细，适合初学者及深入学习使用

第九周学习笔记

Peter的脱发日记

10-05 470

第九周学习笔记 1.论文阅读 Sequential Minimal Optimization: A Fast Algorithm for Training Support Vector Machines 作者：John C.Platt 时间： 1998年主要内容： 1.文章解决了什么问题？ SVM训练算法在大规模问题上收敛很慢，且十分复杂、难以实现，运算过程中需要维持一个n2n^2n2个元素的矩...

svm知网论文

10-15

非监督和监督分类用于多光谱遥感影像的分类，非监督分类使用kmeans算法。

【论文精读】A Support Vector Clustering Method

qq_25011449的博客

07-12 1287

A Support Vector Clustering Method 原文地址：A Support Vector Clustering Method 本文介绍了一种支持向量聚类的方法。 Abstract 本文展示了使用支持向量进行数据聚类的方法，使用核技巧将数据从低维映射到高维，在高维空间中，边界是超球面，低维中边界显示为不规则的几何形状。 Describing Cluster ...

SVM经典论文，如资源描述所示

04-05

1. P. H. Chen, C. J. Lin, and B. Schölkopf, A tutorial on ν-support vector machines, Appl. Stoch. Models. Bus. Ind. 2005, 21, 111-136. 2. A. J. Smola and B. Schölkopf, A tutorial on support vector regression, Stat. Comput. 2004, 14, 199-222. 5. K. R. Müller, S. Mika, G. Rätsch, K. Tsuda, and B. Schölkopf, An introduction to kernel-based learning algorithms, IEEE Trans. Neural Netw. 2001, 12, 181-201. 7. V. N. Vapnik, An overview of statistical learning theory, IEEE Trans. Neural Netw. 1999, 10, 988-999. 8. B. Schölkopf, S. Mika, C. J. C. Burges, P. Knirsch, K. R. Muller, G. Ratsch, and A. J. Smola, Input space versus feature space in kernel-based methods, IEEE Trans. Neural Netw. 1999, 10, 1000-1017. 9. C. J. C. Burges, A tutorial on Support Vector Machines for pattern recognition, Data Min. Knowl. Discov. 1998, 2, 121-167. 10. A. J. Smola and B. Schölkopf, On a kernel-based method for pattern recognition, regression, approximation, and operator inversion, Algorithmica 1998, 22, 211-231.

Python机器学习-信用卡交易的欺诈检测（有数据集）逻辑回归、KNN、决策树、SVM

02-02

Python机器学习-信用卡交易的欺诈检测（有数据集）一：导入数据 ...十二：训练四种类型的分类器（逻辑回归、KNN、决策树、SVM）十三：交叉验证可视化十四：ROC曲线绘制十五：AUC和Accuracy指标计算

SVM各类相关论文及综述

04-09

SVM各类相关论文及综述可以帮助初学者了解SVM 还包括了一个人脸检测的例子代码Vc++ 帮助理解SVM

SVM算法研究--毕业设计论文

06-02

系统阐述支持向量机的统计学习理论，支持向量机理论，描述SVM训练算法，着重描述SMO算法

SVM图像分类论文1

03-13

SVM图像分类论文1：超像素词包模型与SVM分类的图像标注、多特征筛选与支持向量机相融合的图像分类模型等

SVM图像分类论文

03-13

SVM图像分类论文：基于LatentSVM的人体目标检测与跟踪方法研究、基于LBP和SVM的工件图像特征识别研究、基于MATLAB的遥感图像SVM分类系统实现等

[论文解读]2017 TPAMI A Deep Matrix Factorization Method for Learning Attribute Representations

libertyhhn的博客

04-06 1124

[论文解读]2017 TPAMI A Deep Matrix Factorization Method for Learning Attribute RepresentationsA Deep Matrix Factorization Method for Learning Attribute Representations文章创新点Deep Semi-NMF模型与优化非线性激活函数的加入及优化实...

《MA‑CRNN: a multi‑scale attention CRNN for Chinese text line recognition in natural scenes》论文阅读

prague6695的博客

09-09 787

参考博文： CRNN的一个变种，可以读一读，看看相对于CRNN来说有什么变化？以及为什么？文章目录make decisionstep1:读摘要step2:读Introductionstep3:读 Conclusionstep4:读 Related works2.1 基于单字符的文本行识别方法2.2 基于整行文本的文本行识别方法step5:The multi‑scale attention CRNN3.1 不对称卷积特征重用网络3.3 识别组件3.3.1 带有注意力的双向LSTM3.3.2 CTClayer

【Paper Note】Support Vector Clustering 论文翻译（未完待续）

roguesir的博客

07-12 1048

Support Vector Clustering 论文翻译

支持向量机SVM(Support Vector Machine）是一个有监督的学习模型

热门推荐

share

11-06 3万+

前言动笔写这个支持向量机(support vector machine)是费了不少劲和困难的，原因很简单，一者这个东西本身就并不好懂，要深入学习和研究下去需花费不少时间和精力，二者这个东西也不好讲清楚，尽管网上已经有朋友写得不错了(见文末参考链接)，但在描述数学公式的时候还是显得不够。得益于同学白石的数学证明，我还是想尝试写一下，希望本文在兼顾通俗易懂的基础上，真真正正能足以成为一

【论文精读】SVM for Clustering

A Support Vector Method for Clustering

Abstract

Describing Cluster Boundaries with Support Vectors

Support Vector Clustering (SVC)

Overlapping clusters（不是很懂）

The iris data

Varying q q q and CCC

Varying $q$ and $C$