改进的基于多视图和张量低秩表达的子空间聚类算法

最新推荐文章于 2024-07-20 09:21:06 发布

不易撞的网名

最新推荐文章于 2024-07-20 09:21:06 发布

阅读量943

点赞数 26

分类专栏：机器学习文章标签：算法聚类机器学习

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140132432

版权

机器学习专栏收录该内容

220 篇文章 0 订阅

订阅专栏

参考文献：面向高维数据的聚类算法设计和张量低秩表示研究卓林琳

针对高维数据集中簇内分布不均匀的问题，本文提出的改进的基于多视图和张量低秩表达的子空间聚类算法（MVTLR-HCFS）是一种综合性的算法，旨在通过多视图信息的融合和张量低秩表示技术，提高聚类的准确性和鲁棒性。该算法主要包含以下几个关键步骤和涉及的公式：

1. 多视图子空间表达优化

首先，算法针对高维数据集中的多视图特征数据，利用低秩表达来处理噪声和数据损坏问题。具体优化问题可表示为：
$\min_{Z(v),E(v)} \sum_{v=1}^{V} (\text{rank}(Z(v)) + \lambda_v L(X(v), X(v)Z(v)))$
$\text{s.t. } X(v) = X(v)Z(v) + E(v), \quad v=1,\ldots,V$
其中， $Z (v)$ 表示第 $v$ 个视图的子空间表达矩阵， $\text{rank}(Z(v))$ 表示矩阵 $Z$ 的 秩， $E (v)$ 为误差矩阵， $\lambda_v$ 是正则化参数， $L$ 为损失函数，旨在最小化重构误差。

2. 张量低秩表达转换

为充分利用多视图间的互补信息，算法将多视图的数据堆叠成张量，将优化问题转换为求解张量的低秩表达问题：
$\min_{Z,E} \|E\|_{2,1} + \lambda \|Z\|_*$
$\text{s.t. } X(v) = X(v)Z(v) + E(v), \quad v=1,\ldots,V$
$\Psi(Z(1),\ldots,Z(V))$
$[E(1);\ldots;E(V)]$
其中， $\|\cdot\|_{2,1}$ 是2,1范数，倾向于使误差张量的列向量稀疏，从而处理噪声点和数据损坏； $Z\|_*$ 是张量的核范数，反映了张量的低秩性； $\Psi$ 是一个操作，将多个视图的子空间表达矩阵融合成一个张量。

3. 核正则化

张量的低秩约束通过核正则化实现，其公式为：
$\|\mathcal{Z}\|_* = \sum_{m=1}^{M} \xi_m \|\mathcal{Z}(m)\|_*$
其中， $\mathcal{Z}$ 是张量， $\mathcal{Z}(m)$ 表示在第 $m$ 个模态下的矩阵展开式， $\xi_m$ 是系数常量，满足 $\sum_{m=1}^{M} \xi_m = 1$ ，确保整体低秩性。

4. 优化求解

采用交替最小化（ALM）策略求解上述优化问题，具体地，对公式 $F (Z (v))$ 应用ALM，得到：
$\|X(v) - X(v)Z(v)\|_F^2 + \lambda_S \alpha(v) \text{tr}(Z(v)L(v)(Z(v))^T)+ \lambda_V \sum_{w=1, w \neq v}^V \text{HSIC}(Z(v), Z(w))$
其中， $\text{HSIC}$ 是希尔伯特-施密特独立核检验（Hilbert-Schmidt Independence Criterion），用来衡量不同视图间的独立性，避免错误的互补信息。

5. 融合相似度矩阵与HCFS算法

通过上述步骤获得子空间表达后，利用得到的子空间信息构建相似度矩阵，并结合HCFS算法处理簇内分布不均匀问题，具体实施步骤包括子簇的形成和合并，以及利用能同时度量相邻子簇间连通性和相似性的方法，降低参数设置难度，最终实现对高维数据集簇内不均匀分布的有效聚类。

综上所述，该算法通过结合多视图信息的张量低秩表示和层次化策略的密度峰值聚类，有效地处理了高维数据中簇内分布不均匀的问题，提高了聚类的准确性和鲁棒性。

不易撞的网名

关注

26
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
改进的基于多视图和张量低秩表达的子空间聚类算法

针对，本文提出的改进的基于多视图和张量低秩表达的子空间聚类算法（MVTLR-HCFS）是一种综合性的算法，旨在通过多视图信息的融合和张量低秩表示技术，提高聚类的准确性和鲁棒性。
复制链接

扫一扫