基于张量的聚类算法——基于张量学习的多视图谱聚类算法（Tensor Learning-based Multi-view Spectral Clustering, TL-MSC）

最新推荐文章于 2024-11-21 09:30:00 发布

不易撞的网名

最新推荐文章于 2024-11-21 09:30:00 发布

阅读量1.1k

点赞数 30

分类专栏：机器学习文章标签：算法聚类学习

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140386302

版权

234 篇文章

订阅专栏

基于张量学习的多视图谱聚类算法（Tensor Learning-based Multi-view Spectral Clustering, TL-MSC）是一种先进的机器学习技术，它将多视图数据表示为高维张量，并利用张量分解和谱聚类来识别数据中的潜在群集结构。

这种算法尤其适用于处理具有多个不同视角或表示的数据集，例如图像、文本和社交网络数据。

数据张量化：将多视图数据集表示为一个高阶张量 $\mathcal{T} \in \mathbb{R}^{I_1 \times I_2 \times ... \times I_N}$ ，其中 $N$ 是视图的数量，每个 $I_n$ 表示第 $n$ 个视图的数据点数目。

$\mathcal{T} \approx \sum_{r=1}^{R} \lambda_r \mathbf{a}^{(1)}_r \circ \mathbf{a}^{(2)}_r \circ ... \circ \mathbf{a}^{(N)}_r$

这里， $\lambda_r$ 是权重， $\mathbf{a}^{(n)}_r$ 是第 $n$ 个视图下第 $r$ 个成分的向量， $\circ$ 表示外积操作。

$\mathcal{T} \approx \mathcal{G} \times_1 \mathbf{A}^{(1)} \times_2 \mathbf{A}^{(2)} \times_3 ... \times_N \mathbf{A}^{(N)}$

这里， $\mathcal{G}$ 是核心张量， $\mathbf{A}^{(n)}$ 是第 $n$ 个视图的因子矩阵， $\times_n$ 表示沿着第 $n$ 个模式的乘法。

$\mathbf{F} = \sum_{n=1}^{N} w_n \mathbf{A}^{(n)}$

这里， $\mathbf{F}$ 是融合后的矩阵， $w_n$ 是第 $n$ 个视图的权重。

$L = D - W$

这里， $D$ 是度矩阵， $W$ 是权重矩阵，通常基于 $\mathbf{F}$ 中的数据点相似度计算。

TL-MSC 算法通过将多视图数据表示为张量，并结合张量分解和谱聚类技术，能够有效处理和分析复杂多样的数据集，尤其在数据包含多个互补或冗余视图时表现突出。