多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)是一种用于处理和分析来自不同视角或模态的数据的技术。

它特别适用于处理多模态数据集,例如,从文本、图像、视频、音频等多种来源收集的数据。

MVDA的目标是找到一个低维的公共表示,使得不同模态或视图的数据在该表示下能够更好地分离不同的类别。

MVDA的核心思想

MVDA试图在多个视图之间找到一种联合的表示,这种表示能够在不同视图间保持数据的内在结构和关系,同时增强不同类别的可分性

在最简单的形式下,MVDA可以被视为多视图线性鉴别分析(Multi-View Linear Discriminant Analysis, MV-LDA)的推广,但更广泛的MVDA框架可以包括非线性映射和其他更复杂的模型。

公式和解释

让我们以MV-LDA为例,来探讨多视图鉴别分析的基本原理和公式。在MV-LDA中,我们考虑了两个主要矩阵:类内散度矩阵 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习类间散度矩阵 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_02

类内散度矩阵 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习

类内散度矩阵描述了同一类别内部样本的分布情况,我们希望这个矩阵越小越好,意味着同一类内的样本越接近。

经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_04

其中 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_05视图的总数经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_06 是第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_07 个视图的类内散度矩阵。

对于第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_07

经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习_09

  • 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_10类别数
  • 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_11 是第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_模态_12 视图中第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_13样本
  • 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习_14 是第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_模态_12 视图中第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_模态_16 类的样本均值向量。
类间散度矩阵 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_02

类间散度矩阵则描述了不同类别之间的分布情况,我们希望这个矩阵越大越好,意味着不同类别的样本在低维空间中更易于区分。

经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习_18

对于第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_07

经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习_20

  • 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_21 是第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_模态_16 类的样本数;
  • 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_数据_23 是第 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_模态_12 视图的所有样本的总均值向量。
最终目标

MV-LDA的目标是找到一个投影矩阵 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_25 ,使得投影后的数据在类间差异最大化,同时类内差异最小化。这可以通过最大化下面的目标函数来实现:

经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_26

其中:

  • 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_模态_27 表示矩阵的迹(即对角线元素的和)
求解

为了求解 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_25,我们通常会构造一个拉格朗日乘子问题,然后求解广义特征值问题:

经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_29

其中 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_30 是特征值,经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_25

通过求解这个广义特征值问题,我们可以找到最佳的投影矩阵 经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_python_25进而得到多视图数据的低维表示。

小结

多视图鉴别分析是一种强大的工具,用于处理多模态数据,它能够有效地融合来自不同视图的信息,提高分类和识别的性能。
通过优化类内和类间散度矩阵的比例,MVDA能够找到一个能够最好地区分不同类别的投影方向。