什么是多模态谱聚类(MMSC)

最新推荐文章于 2024-12-17 11:07:30 发布

不易撞的网名

最新推荐文章于 2024-12-17 11:07:30 发布

阅读量1.4k

点赞数 13

分类专栏：机器学习文章标签：聚类支持向量机机器学习

本文链接：https://blog.csdn.net/weixin_50569789/article/details/139721336

版权

机器学习专栏收录该内容

234 篇文章

订阅专栏

多模态谱聚类（Multi-modal Spectral Clustering, MMSC）是一种处理具有多个表示或视图的数据集的聚类方法。它旨在通过融合不同模态或视图下的互补信息来提高聚类性能。
MMSC的核心在于构建一个综合所有视图信息的拉普拉斯矩阵，并在此基础上执行谱聚类，以得到最终的聚类结果。
具体来说，MMSC通过最小化每个视图的谱聚类误差和最小化多模态聚类的标签矩阵与每个视图的标签矩阵之间的距离来优化目标函数。

具体例子与步骤

例子场景：考虑一个图像数据集，其中每个图像有三个不同的特征表示或视图：颜色信息、纹理信息和形状信息。我们的目标是将这些图像根据它们的内容相似性进行聚类。

涉及的公式:
MMSC的目标函数可以表示为：
$\min_{G\geq0, G^\top G=I} \sum_{i=1}^m \text{tr}[(G^{(i)})^\top L^{(i)} G^{(i)}] + \alpha \text{tr}[(G - G^{(i)})^\top(G - G^{(i)})]$
$G^{(i)} 是针对第 i 个视图的聚类标签矩阵， L^{(i)} 是第 i 个视图的拉普拉斯矩阵， \alpha 是一个惩罚系数，用于控制各视图间的一致性。$

计算步骤:

数据预处理: 对每个视图的数据进行标准化处理，确保不同特征尺度的公平比较。
构建相似矩阵与拉普拉斯矩阵:
- $对于每个视图 v ，计算相似矩阵 S^{(v)} ，通常基于样本间距离或相似度。$
- $计算归一化拉普拉斯矩阵 L^{(v)} = D^{(v)} - S^{(v)} ，其中 D^{(v)} 是 S^{(v)} 的对角度矩阵，用于度量每个样本的度。$
优化目标函数:
- $根据目标函数，通过交替优化方法求解 G^{(i)} ，首先固定 G ，求解 G^{(i)} ，再固定 G^{(i)} 更新 G 。$
- $G^{(i)} = \alpha(L^{(i)} + \alpha I)^{-1}G 来迭代更新 G^{(i)} 。$
求解最终聚类标签矩阵:
- 将上述更新步骤重复执行，直至达到某种收敛准则，比如 ( G ) 的变化小于某个阈值。
- 最终的 ( G ) 表示所有视图数据的综合聚类标签。
聚类:
- 将优化后的 ( G ) 应用于原始数据，根据其行向量分配每个样本到相应的聚类。

在这个过程中，MMSC通过融合不同视图的信息，可以有效应对单一视图中可能存在的噪声和不完整性，从而提升聚类的准确性和鲁棒性。

例子

数据集描述

模态1（Text）：包含10篇文章的关键词频率向量，每篇文章用一个100维的向量表示。
模态2（Image）：每篇文章对应一张图片，通过图像处理技术转化为100维的特征向量。

目标

将这10篇文章根据它们的文本内容和图像特征分成3个主题类别。

步骤1：数据预处理

对每个模态的数据进行标准化处理，确保所有特征在相同尺度上比较。

步骤2：构建相似度矩阵

$对于每个模态 v，构建相似度矩阵 S^{(v)}，使用余弦相似度衡量样本间的相似性。$

$S_{ij}^{(v)} = \frac{\mathbf{x}_i^{(v)} \cdot \mathbf{x}_j^{(v)}}{\|\mathbf{x}_i^{(v)}\|_2 \|\mathbf{x}_j^{(v)}\|_2}$
$其中，\mathbf{x}_i^{(v)} 表示模态 v 下第 i 个样本的特征向量。$

步骤3：构造拉普拉斯矩阵

$计算每个模态的归一化拉普拉斯矩阵 L^{(v)}。$

$D^{(v)} = \text{diag}(S^{(v)} \mathbf{1})$
$L^{(v)} = D^{(v)} - S^{(v)}$
$其中，\mathbf{1} 是一个全1向量，D^{(v)} 是 S^{(v)} 的对角度矩阵。$

步骤4：MMSC目标函数

定义MMSC的优化目标，最小化各模态的谱聚类误差和模态间标签矩阵的一致性误差。

$\min_{G} \sum_{v=1}^2 \text{Tr}(G^\top L^{(v)} G) + \alpha \sum_{v=1}^2 \text{Tr}((G - G^{(v)})^\top (G - G^{(v)}))$
$是最终的聚类标签矩阵，G^{(v)} 是基于单模态 v 的聚类结果，\alpha是一个调节模态间一致性和模态内聚类质量的权重参数。$

步骤5：求解G

$使用迭代算法求解 G，一种方法是交替优化 G^{(v)} 和 G。$

$固定 G，求解每个模态的 G^{(v)}。$
$G^{(v)} = (\alpha I + L^{(v)})^{-1}G$
$固定 G^{(v)}，更新 G。这个步骤可能涉及迭代求解或使用其他优化技术。$

步骤6：聚类

当 (G) 收敛或达到预定迭代次数后，使用 (G) 对每个样本分配聚类标签。

结果评估

使用外部指标（如ARI、NMI）评估聚类结果的质量。

import numpy as np
from sklearn.decomposition import PCA
from sklearn.cluster import KMeans
from sklearn.metrics.pairwise import cosine_similarity
from scipy.sparse import diags, eye
from scipy.sparse.linalg import eigsh

# 假设数据
# 模态1（文本特征）和模态2（图像特征）
modality1_data = np.random.rand(10, 100)  # 10个样本，每个样本100维特征
modality2_data = np.random.rand(10, 128)  # 同理，10个样本，每个样本128维特征

# 数据预处理：标准化
modality1_data = (modality1_data - modality1_data.mean(axis=0)) / modality1_data.std(axis=0)
modality2_data = (modality2_data - modality2_data.mean(axis=0)) / modality2_data.std(axis=0)

# 构建相似度矩阵
def build_similarity_matrix(data):
    similarity_matrix = cosine_similarity(data)
    return similarity_matrix

similarity_matrix1 = build_similarity_matrix(modality1_data)
similarity_matrix2 = build_similarity_matrix(modality2_data)

# 构造拉普拉斯矩阵
def laplacian_matrix(similarity_matrix):
    degree_matrix = diags(np.sum(similarity_matrix, axis=1))
    return degree_matrix - similarity_matrix

laplacian1 = laplacian_matrix(similarity_matrix1)
laplacian2 = laplacian_matrix(similarity_matrix2)

# 简化示例：交替优化寻找聚类标签（此处使用PCA降维和K-means作为代替）
# 实际MMSC涉及更复杂的优化过程，这里仅示意

# 假设初始聚类中心由第一个模态的KMeans得到
k = 3  # 假设聚类数为3
initial_labels = KMeans(n_clusters=k).fit_predict(modality1_data)
G = np.eye(k)[initial_labels]

# 交替优化简化步骤（理想情况下应迭代优化G和Gv）
# 这里省略了实际的交替优化步骤，直接展示如何利用G进行后续处理
# 实际操作中，您需要设计循环来交替更新G和Gv，并且可能需要梯度下降或其他优化策略

# 假设已得到最终的G，使用G进行聚类
# 注意，真实实现中需要根据G进行具体操作，这里直接使用KMeans展示
final_clusters = KMeans(n_clusters=k).fit_predict(np.hstack((modality1_data, modality2_data)))

print("Final cluster labels:", final_clusters)
Final cluster labels: [0 1 2 1 2 0 1 0 0 0]