核广义典型相关分析(Kernel Generalized Canonical Correlation Analysis, KGCCA)是一种用于多视图数据的分析方法,它结合了核方法(Kernel Methods)和广义典型相关分析(Generalized Canonical Correlation Analysis, GCCA)的优点。

KGCCA主要用于分析多个数据集之间的关系,尤其是当这些数据集是从同一对象的不同视角获取时。

通过使用核函数,KGCCA能够在高维甚至无限维的空间中执行线性CCA,从而捕捉到数据的非线性结构。

基本概念

在传统的CCA中,目标是找到两个数据集 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_特征值基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_特征值_02 之间的线性组合,使得这两个组合之间的相关性最大化

GCCA是CCA的扩展,可以处理多个数据集的情况,而KGCCA进一步扩展了GCCA,使其能够处理非线性关系。

公式

假设我们有 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_特征值_03 个视图的数据集 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_04 ,其中每个数据集都包含相同的样本,但可能有不同的特征表示。

KGCCA的目标是找到一系列投影 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_05 ,使得每个数据集投影到一个共享的低维空间中,从而最大化这些投影之间的相关性。

最大化相关性的公式

在KGCCA中,我们尝试最大化以下表达式:

基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_06

其中,

基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_相关分析_07

  • 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_相关分析_08 表示第 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_09 个视图和第 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_相关分析_10 个视图投影之后的典型相关性系数。
  • 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_11基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_相关分析_12基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_数据集_13 之间的交叉核矩阵
  • 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_14基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_15 分别是 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_相关分析_12基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_数据集_13 自身的核矩阵。
  • 这些核矩阵是由核函数 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_数据集_18 生成的,它将原始数据映射到高维空间使得在该空间中的线性运算相当于原始空间中的非线性运算。
解决方案

为了找到最佳的投影 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_05 ,KGCCA通过求解一个广义特征值问题来实现
具体而言,它寻找 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_05 使得下面的广义特征值问题成立:

基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_特征值_21
其中

  • 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_学习方法_22特征值
  • 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_相关分析_23相应的特征向量,它们定义了数据集 基于典型相关性分析的多视图学习方法(基于核技术的 CCA)——核广义典型相关分析(KGCCA)_特征值_24投影方向。
总结

KGCCA通过在高维特征空间中执行CCA来寻找多个数据集之间的非线性关系。它使用核函数来避免直接在高维空间中操作数据,这不仅减少了计算成本,还使得分析能够捕捉到更复杂的模式。