基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)...

1835117

于 2024-07-16 02:42:59 发布

阅读量25

点赞数

文章标签：算法聚类机器学习人工智能数据挖掘

基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph, MVSC）是一种高效的多视图聚类方法，它利用二部图结构来表示数据点和特征之间的关系，进而通过谱聚类实现数据的分组。

这种方法特别适用于处理大规模数据集，同时能够有效利用多视图数据的互补信息。下面是对这一模型的详细介绍。

MVSC模型概述

MVSC模型的核心在于构建和利用二部图来捕捉数据点和特征之间的关系，从而在每个视图下学习一个相似度矩阵。

随后，这些相似度矩阵被融合以形成一个统一的表示，最后通过谱聚类技术进行数据点的分组。

步骤与公式

1. 构建二部图

对于每个视图基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_邻接矩阵，构建一个二部图，其中一个部分节点集代表数据点，另一个部分节点集代表特征。

如果数据点基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_聚类_03 在特征上非零，就在二部图中添加一条边。

2. 生成相似度矩阵

从每个二部图基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_聚类_02 中，通过邻接矩阵 计算相似度矩阵。

邻接矩阵基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_相似度_07 描述了数据点和特征之间的连接，而相似度矩阵

邻接矩阵：是一个的矩阵，其中是数据点的数量，是特征的数量。如果数据点与特征 相关联，则，否则。
相似度矩阵：通常通过计算邻接矩阵的某种变换来获得，例如，可以通过图拉普拉斯矩阵

基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_算法_21

其中，基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_聚类_22 是的度矩阵，即。

3. 融合相似度矩阵

融合所有视图的相似度矩阵基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_聚类_08 成一个统一的相似度矩阵。

这可以通过加权平均或更复杂的融合策略实现，以反映不同视图的重要性。

基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_算法_27

其中，基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_相似度_28 是视图的总数，是第

4. 谱聚类

最后，应用谱聚类算法在融合后的相似度矩阵基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_邻接矩阵_26

这通常涉及构建图拉普拉斯矩阵 基于多核的聚类算法——基于二部图的大尺度多视图谱聚类模型（Large-scale Multi-view Spectral Clustering via Bipartite Graph)_邻接矩阵_32 ，然后对其进行特征分解，选择前个特征向量进行 -means 聚类。