基于非负矩阵分解的多视图学习——潜在语义感知的多视图多标签学习方法（Latent Semantic-aware Multi-view Multi-label Learning, 简称 LSVML）

不易撞的网名

于 2024-07-11 14:34:44 发布

阅读量1k

点赞数 15

文章标签：矩阵学习学习方法

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140328867

版权

潜在语义感知的多视图多标签学习方法（Latent Semantic-aware Multi-view Multi-label Learning, 简称 LSVML）是一种用于处理包含多个特征视图和多个标签的数据集的机器学习技术。

这类方法特别适用于文本、图像和其他复杂数据类型，其中数据可以从多个角度（视图）进行描述，并且可以属于多个类别（多标签）。

核心思想

LSVML 方法利用潜在语义分析（LSA）或类似的技术来捕获数据中的隐藏结构，并将其应用于多视图和多标签的学习场景中。

LSA 或 LDA（潜在狄利克雷分配）可以帮助识别数据中的主题或概念，而多视图学习则考虑了数据的多个表示或视角，以获得更全面的理解。

多标签学习允许每个样本可以被分配多个标签，这在现实世界的数据集中很常见。

目标函数

LSVML 的目标函数可能会结合多视图的表示和多标签的预测，同时考虑到潜在语义结构。一个可能的目标函数可以表示为：

$\min_{\mathbf{W}, \mathbf{H}, \mathbf{Y}} \sum_{v=1}^V \left\| \mathbf{X}_v - \mathbf{X}_v \mathbf{W}_v \mathbf{H} \right\|_F^2 + \lambda \left\| \mathbf{Y} - \mathbf{H} \mathbf{B} \right\|_F^2 + \gamma \Omega(\mathbf{H})$

其中，

$\mathbf{X}_v$ 是第 $v$ 视图的数据矩阵。
$\mathbf{W}_v$ 和 $\mathbf{H}$ 分别是第 $v$ 视图的权重矩阵和共享的潜在语义矩阵。
$\mathbf{Y}$ 是多标签的预测矩阵。
$\mathbf{B}$ 是连接潜在语义矩阵和标签矩阵的转换矩阵。
$\left\| \cdot \right\|_F$ 表示 Frobenius范数，用于度量矩阵之间的差异。
$\lambda$ 和 $\gamma$ 是正则化参数，用于平衡不同部分的损失。
$\Omega(\mathbf{H})$ 是针对 $\mathbf{H}$ 的正则化项，如稀疏性或低秩性，以控制潜在语义矩阵的复杂度。

公式解释

$\mathbf{X}_v$ ：表示第 $v$ 视图的数据矩阵，尺寸为 $\times M_v$ ，其中 $N$ 是样本数量， $M_v$ 是第 $v$ 视图的特征数量。
$\mathbf{W}_v$ ：是第 $v$ 视图的权重矩阵，尺寸取决于 $\mathbf{X}_v$ 和 $\mathbf{H}$ 的维度，用于从 $\mathbf{X}_v$ 到 $\mathbf{H}$ 的转换。
$\mathbf{H}$ ：共享的潜在语义矩阵，尺寸为 $\times K$ ，其中 $K$ 是潜在语义的数量。
$\mathbf{Y}$ ：预测的标签矩阵，尺寸为 $\times L$ ，其中 $L$ 是可能的标签数量。
$\mathbf{B}$ ：转换矩阵，尺寸为 $\times L$ ，用于从潜在语义空间到标签空间的转换。
$\left\| \mathbf{X}_v - \mathbf{X}_v \mathbf{W}_v \mathbf{H} \right\|_F^2$ ：表示原始数据矩阵 $\mathbf{X}_v$ 和通过 $\mathbf{W}_v$ 和 $\mathbf{H}$ 重构的数据之间的 Frobenius 范数误差。
$\left\| \mathbf{Y} - \mathbf{H} \mathbf{B} \right\|_F^2$ ：表示预测的标签矩阵 $\mathbf{Y}$ 和从潜在语义矩阵 $\mathbf{H}$ 通过转换矩阵 $\mathbf{B}$ 得到的预测之间的误差。
$\Omega(\mathbf{H})$ ：正则化项，用于控制 $\mathbf{H}$ 的复杂度，保证模型的泛化能力和避免过拟合。