自适应近聚类（Clustering and Projected Clustering with Adaptive Neighbors）

最新推荐文章于 2024-04-15 11:34:39 发布

Robert_Gordon

最新推荐文章于 2024-04-15 11:34:39 发布

阅读量5.7k

点赞数 20

分类专栏：聚类论文文章标签：图论

本文链接：https://blog.csdn.net/Robert_Gordon/article/details/106681393

版权

聚类论文专栏收录该内容

6 篇文章 9 订阅

订阅专栏

在谱聚类中，构造邻接矩阵时，对于每个边的权重需要用高斯核函数来构造，对此需要调节参数 $\sigma$ ,嗯嗯…我们知道调参是一件很无意义的事情，鲁棒性不是很好。
在这里插入图片描述
那么如何解决这个问题？
聂飞平大佬14年提出了自适应近邻构造图的方法（CAN），Clustering and Projected Clustering with Adaptive Neighbors，接下来我们简单的介绍一下CAN方法。
该算法的含义很简单：“距离较小的数据点成为邻居的可能性较大”这一先验知识的前提下，引入了概率邻居，在局部距离的基础上通过为每个数据点分配自适应最优的邻居学习数据。
设Ｘ中的每一个点 $x_{i}$ 与 $x_j$ 成为邻居的概率为 $s_{ij}$ 。若 $x_{i}$ 与 $x_j$ 之间的距离 $x_{i}- x_j \|_2^{2}$ 越小，则
$x_{j}$ 成为 $x_i$ 邻居的概率 $s_{ij}$ 越大。 $s_{ij}$ 是一个邻居概率，因此，求解 $s_{ij}$ ，问题转化为求解如下：
在这里插入图片描述
对目标函数进行优化求解，上述公式可以写为:

其中

在这里可能有些同学有些疑问了，目标函数是怎么转换的呢？ 推导过程如下，由于时间关系就写在纸张上了。
在这里插入图片描述

然后通过拉格朗日和KKT条件进行求解，得到 $S$ 和 $\gamma$
在这里插入图片描述

其中 $\tilde{k}$ 代表的是离数据点 $x_i$ 最近的 $\tilde{k}$ 个邻居。

在邻居分配中得到的概率矩阵Ｓ是一个ｎ×ｎ矩阵，可将其看作图论中的邻接矩阵（有时也称相似矩阵），ｎ个数据点作为图的节点，则根据图论中的拉普拉斯矩阵 $L_S=D-\frac{S+S^T}{2}$ 。
由于相似矩阵Ｓ是半正定矩阵，在图论中具有如下重要定理。
定理１：相似矩阵Ｓ对应的拉普拉斯矩阵 $L_S$ 特征值为０的重数 c 等于图论中相似矩阵Ｓ的连通分量的个数。
因此， $L_S$ 的秩 $rank（Ｌ_S）＝ｎ－ｃ$ ，那么得到的连通分量的个数刚好为ｃ个，这时的邻居分配是自适
应的理想分配，并且基于Ｓ将点分成了ｃ个簇类。
最终，CAN的目标函数如此：
在这里插入图片描述