多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)是一种用于处理和分析来自不同视角或模态
的数据的技术。
它特别适用于处理多模态数据集
,例如,从文本、图像、视频、音频等多种来源收集的数据。
MVDA的目标是找到一个低维的公共表示
,使得不同模态或视图的数据在该表示下能够更好地分离不同的类别。
MVDA的核心思想
MVDA试图在多个视图之间找到一种联合
的表示,这种表示能够在不同视图间保持数据的内在结构和关系
,同时增强不同类别的可分性
。
在最简单的形式下,MVDA可以被视为多视图线性鉴别分析(Multi-View Linear Discriminant Analysis, MV-LDA)的推广
,但更广泛的MVDA框架可以包括非线性映射和其他更复杂的模型。
公式和解释
让我们以MV-LDA为例,来探讨多视图鉴别分析的基本原理和公式。在MV-LDA中,我们考虑了两个主要矩阵:类内
散度矩阵 和
类间
散度矩阵 。
类内散度矩阵 ![经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习](https://math-api.51cto.com/?from=%20%20%20%20%20%20%20%20S_w%20)
类内
散度矩阵描述了同一类别
内部样本的分布情况,我们希望这个矩阵越小越好,意味着同一类内的样本越接近。
其中 是
视图的总数
, 是第
个视图的
类内
散度矩阵。
对于第
是
类别数
;是第
视图中第
个
样本
;是第
视图中第
类的
样本均值向量。
类间散度矩阵 ![经典子空间学习的多视图学习方法——多视图鉴别分析(Multi-View Discriminant Analysis, MVDA)_学习方法_02](https://math-api.51cto.com/?from=%20%20%20%20%20%20%20%20S_b%20)
类间散度矩阵则描述了不同类别之间的分布情况,我们希望这个矩阵越大越好,意味着不同类别的样本在低维空间中更易于区分。
对于第
是第
类的
样本数;
是第
视图的
所有样本的总均值向量。
最终目标
MV-LDA的目标是找到一个投影矩阵
,使得投影后的数据在
类间
差异最大化,同时类内
差异最小化。这可以通过最大化
下面的目标函数来实现:
其中:
表示矩阵的
迹(即对角线元素的和)
。
求解
为了求解 ,我们通常会构造一个
拉格朗日乘子
问题,然后求解广义特征值问题:
其中 是特征值,
通过求解这个广义特征值问题,我们可以找到最佳的投影矩阵
,
进而得到多视图数据的低维表示。
小结
多视图鉴别分析是一种强大的工具,用于处理多模态数据,它能够有效地融合
来自不同视图的信息,提高分类和识别的性能。
通过优化类内和类间
散度矩阵的比例,MVDA能够找到一个能够最好地区分不同类别的投影方向。