基于典型相关性分析的多视图学习方法(基于神经网络的 CCA)——非线性典型相关性分析(NLCCA)

非线性典型相关性分析(Nonlinear Canonical Correlation Analysis, NLCCA)是典型相关分析(CCA)的扩展,旨在处理数据中的非线性关系

与传统CCA仅能识别线性相关性不同,NLCCA利用神经网络等非线性模型来捕获数据间的复杂非线性结构。

这种方法由Hsieh等人提出,将前馈神经网络应用于CCA中,从而能够探索更广泛的关联模式。

原理与步骤

NLCCA的基本思想是先使用非线性变换将原始数据映射到一个新的特征空间,在这个空间中再进行CCA分析。具体步骤如下:

  1. 非线性变换:使用前馈神经网络对输入数据 X \mathbf{X} X Y \mathbf{Y} Y 进行非线性变换,生成新的表示 Z X = g ( X ; θ X ) \mathbf{Z}_X = g(\mathbf{X}; \theta_X) ZX=g(X;θX) Z Y = g ( Y ; θ Y ) \mathbf{Z}_Y = g(\mathbf{Y}; \theta_Y) ZY=g(Y;θY) ,其中 g ( ⋅ ) g(\cdot) g()非线性函数, θ X \theta_X θX θ Y \theta_Y θY神经网络的权重参数

  2. CCA分析:在变换后的表示 Z X \mathbf{Z}_X ZX Z Y \mathbf{Z}_Y ZY 上执行CCA,以找到两个数据集之间的最大相关性。CCA的目标是找到投影向量 u \mathbf{u} u v \mathbf{v} v ,使得 Z X u \mathbf{Z}_X\mathbf{u} ZXu Z Y v \mathbf{Z}_Y\mathbf{v} ZYv相关性最大化。

  3. 联合优化:最后,通过反向传播算法同时优化神经网络的参数 θ X \theta_X θX θ Y \theta_Y θY 以及CCA的投影向量 u \mathbf{u} u v \mathbf{v} v ,以最大化 Z X u \mathbf{Z}_X\mathbf{u} ZXu Z Y v \mathbf{Z}_Y\mathbf{v} ZYv 之间的相关性。

目标函数

NLCCA的目标函数可以表示为:

max ⁡ u , v , θ X , θ Y u ⊤ C Z X Z Y v u ⊤ C Z X Z X u ⋅ v ⊤ C Z Y Z Y v \max_{\mathbf{u}, \mathbf{v}, \theta_X, \theta_Y} \frac{\mathbf{u}^\top \mathbf{C}_{Z_XZ_Y} \mathbf{v}}{\sqrt{\mathbf{u}^\top \mathbf{C}_{Z_XZ_X} \mathbf{u} \cdot \mathbf{v}^\top \mathbf{C}_{Z_YZ_Y} \mathbf{v}}} u,v,θX,θYmaxuCZXZXuvCZYZYv uCZXZYv

其中,

  • C Z X Z Y \mathbf{C}_{Z_XZ_Y} CZXZY 是变换后的数据 Z X \mathbf{Z}_X ZX Z Y \mathbf{Z}_Y ZY 之间的互协方差矩阵。
  • C Z X Z X \mathbf{C}_{Z_XZ_X} CZXZX C Z Y Z Y \mathbf{C}_{Z_YZ_Y} CZYZY 分别是 Z X \mathbf{Z}_X ZX Z Y \mathbf{Z}_Y ZY协方差矩阵。

参数解释

  • X \mathbf{X} X Y \mathbf{Y} Y :原始输入数据集。
  • Z X \mathbf{Z}_X ZX Z Y \mathbf{Z}_Y ZY通过非线性变换获得的新表示。
  • u \mathbf{u} u v \mathbf{v} v :CCA中的投影向量。
  • C Z X Z Y \mathbf{C}_{Z_XZ_Y} CZXZY C Z X Z X \mathbf{C}_{Z_XZ_X} CZXZX C Z Y Z Y \mathbf{C}_{Z_YZ_Y} CZYZY :协方差和互协方差矩阵。
  • θ X \theta_X θX θ Y \theta_Y θY神经网络的权重参数

优势

NLCCA的主要优势在于能够处理数据集之间的复杂非线性关系,这对于许多现实世界的应用非常关键,如图像识别、自然语言处理和生物信息学等领域,其中数据的关系往往是高度非线性的。

通过引入非线性变换,NLCCA能够揭示出传统CCA无法捕捉的深层次关联。

结论

非线性典型相关性分析(NLCCA)是一种强大的多视图学习方法,适用于需要探索数据间复杂非线性关系的场景

通过将神经网络和CCA相结合,NLCCA不仅能够处理高维数据,还能发现隐藏在数据背后的非线性结构,为数据分析提供了更广阔的可能性。

  • 18
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不易撞的网名

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值