基于子空间的多视图聚类算法——带异常值项的基于子空间的多视图聚类模型（Generalized Latent Multi-view Subspace Clustering, gLMSC）

不易撞的网名

于 2024-07-12 17:09:54 发布

阅读量1.2k

点赞数 14

分类专栏：机器学习文章标签：算法聚类机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140384013

版权

机器学习专栏收录该内容

234 篇文章

订阅专栏

带异常值项的基于子空间的多视图聚类模型（Generalized Latent Multi-view Subspace Clustering, gLMSC）是一种针对复杂数据集的高级聚类技术，特别是在存在噪声和异常值的情况下。

gLMSC模型通过在子空间表示的基础上引入异常值检测机制，旨在提高聚类的鲁棒性。

下面是对gLMSC模型的详细解释，包括其步骤、涉及的公式及其作用。

gLMSC模型概述

gLMSC模型的核心思想是利用每个视图的数据在低维子空间上的表示，同时检测和移除异常值，以获得更纯净的表示矩阵。

这有助于提高聚类结果的质量，尤其是当数据集中存在噪声和异常点时。

步骤与公式

1. 初始表示学习

在每个视图 $v$ 上，学习一个表示矩阵 $C_v$ 和异常值矩阵 $E_v$ ，

其中

$C_v$ 描述数据点在子空间上的线性表示
$E_v$ 标识数据中的异常值。

2. 优化目标函数

对于每个视图 $v$ ，gLMSC模型的目标函数如下：

$\min_{C_v, E_v} \frac{1}{2} \|X_v - X_v C_v - E_v\|_F^2 + \lambda_v \|C_v\|_1 + \mu_v \|E_v\|_1$

$X_v$ 是第 $v$ 个视图的数据矩阵；
$C_v$ 是学习到的表示矩阵；
$E_v$ 是异常值矩阵；
$\lambda_v$ 和 $\mu_v$ 是正则化参数，分别控制表示矩阵的稀疏性和异常值矩阵的稀疏性；
$\|\cdot\|_F$ 表示矩阵的弗罗贝尼乌斯范数；
$\|\cdot\|_1$ 表示矩阵的 $l_1$ 范数，用于促进稀疏性。

3. 融合表示矩阵

一旦得到每个视图的表示矩阵 $C_v$ ，接下来需要将它们融合成一个统一的表示矩阵 $C$ 。这可以通过加权平均或更复杂的融合策略实现。

$\sum_{v=1}^V w_v C_v$

$V$ 是视图的总数；
$w_v$ 是第 $v$ 个视图的权重。

4. 聚类

最后，基于融合后的表示矩阵 $C$ ，应用聚类算法（如谱聚类）来划分数据点。

公式的作用

初始表示学习：公式 $\min_{C_v, E_v} \frac{1}{2} \|X_v - X_v C_v - E_v\|_F^2 + \lambda_v \|C_v\|_1 + \mu_v \|E_v\|_1$ 的作用是同时学习表示矩阵和异常值矩阵，确保数据点在子空间上的准确表示，同时检测并排除异常值。
融合表示矩阵：公式 $\sum_{v=1}^V w_v C_v$ 用于融合来自不同视图的信息，以获得一个更全面的表示，这有助于提高聚类的准确性和鲁棒性。
聚类：基于融合后的表示矩阵 $C$ 进行聚类，得到最终的数据分组。

gLMSC模型通过在子空间表示中加入异常值检测，能够更有效地处理带有噪声和异常值的数据，从而在复杂数据集的聚类任务中表现出色。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不易撞的网名 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。