基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)

不易撞的网名

已于 2024-07-12 17:17:25 修改

阅读量574

点赞数 8

分类专栏：机器学习文章标签：算法聚类支持向量机

于 2024-07-12 17:14:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140384307

版权

机器学习专栏收录该内容

221 篇文章 3 订阅

订阅专栏

基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph, MVSC）是一种高效的多视图聚类方法，它利用二部图结构来表示数据点和特征之间的关系，进而通过谱聚类实现数据的分组。

这种方法特别适用于处理大规模数据集，同时能够有效利用多视图数据的互补信息。下面是对这一模型的详细介绍。

MVSC模型概述

MVSC模型的核心在于构建和利用二部图来捕捉数据点和特征之间的关系，从而在每个视图下学习一个相似度矩阵。

随后，这些相似度矩阵被融合以形成一个统一的表示，最后通过谱聚类技术进行数据点的分组。

步骤与公式

1. 构建二部图

对于每个视图 $v$ ，构建一个二部图 $B_v$ ，其中一个部分节点集代表数据点，另一个部分节点集代表特征。

如果数据点 $i$ 在特征 $j$ 上非零，就在二部图中添加一条边 $(i, j)$ 。

2. 生成相似度矩阵

从每个二部图 $B_v$ 中，通过邻接矩阵 $A_v$ 计算相似度矩阵 $S_v$ 。

邻接矩阵 $A_v$ 描述了数据点和特征之间的连接，而相似度矩阵 $S_v$ 反映了数据点之间的相似度。

邻接矩阵： $A_v$ 是一个 $\times m$ 的矩阵，其中 $n$ 是数据点的数量， $m$ 是特征的数量。如果数据点 $i$ 与特征 $j$ 相关联，则 $A_v(i, j) = 1$ ，否则 $A_v(i, j) = 0$ 。
相似度矩阵： $S_v$ 通常通过计算邻接矩阵的某种变换来获得，例如，可以通过图拉普拉斯矩阵 $L_v$ 或其他图形核函数计算得到。一个常见的方法是使用邻接矩阵的归一化形式：

$S_v = D_v^{-1/2} A_v D_v^{-1/2}$

其中， $D_v$ 是 $A_v$ 的度矩阵，即 $D_v(i, i) = \sum_j A_v(i, j)$ 。

3. 融合相似度矩阵

融合所有视图的相似度矩阵 $S_v$ 成一个统一的相似度矩阵 $S$ 。

这可以通过加权平均或更复杂的融合策略实现，以反映不同视图的重要性。

$\sum_{v=1}^V w_v S_v$

其中， $V$ 是视图的总数， $w_v$ 是第 $v$ 个视图的权重。

4. 谱聚类

最后，应用谱聚类算法在融合后的相似度矩阵 $S$ 上进行聚类。

这通常涉及构建图拉普拉斯矩阵 $L$ ，然后对其进行特征分解，选择前 $k$ 个特征向量进行 $k$ -means 聚类。

图拉普拉斯矩阵： $L = D - S$ ，其中 $D$ 是 $S$ 的度矩阵。
特征分解：找到 $L$ 的特征向量和特征值，选取前 $k$ 个与最小特征值对应的特征向量。
$k$ -means聚类：对选取的特征向量进行 $k$ -means 聚类，以确定最终的聚类结果。

公式的作用

邻接矩阵和相似度矩阵： $A_v$ 和 $S_v$ 分别描述了数据点和特征的关系，以及数据点之间的相似度，是构建多视图谱聚类模型的基础。
融合相似度矩阵：公式 $\sum_{v=1}^V w_v S_v$ 用于融合来自不同视图的信息，确保算法能够利用多视图数据的互补特性。
谱聚类：基于融合后的相似度矩阵 $S$ 进行谱聚类，得到最终的数据分组，这是整个算法的最终目的。

MVSC模型通过构建和利用二部图，能够在处理大规模、多视图数据集时提供高效且准确的聚类结果，特别适用于需要同时考虑多种特征和视角的复杂数据分析任务。

不易撞的网名

关注

8
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不易撞的网名 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。