基于典型相关性分析的多视图学习方法——典型相关性分析（Canonical Correlation Analysis, CCA）

不易撞的网名

于 2024-07-07 14:51:01 发布

阅读量527

点赞数 9

分类专栏：机器学习文章标签：学习方法

本文链接：https://blog.csdn.net/weixin_50569789/article/details/140246225

版权

机器学习专栏收录该内容

220 篇文章 0 订阅

订阅专栏

典型相关性分析（Canonical Correlation Analysis, CCA）是经典的挖掘视图相关性的多视图子空间学习方法[38]，主要是计算两视图特征的最大线性投影，使得在投影空间中，两视图特征的相关性最大。

但 CCA 存在两个局限:

第一，只适用于两视图学习；
第二，只能进行线性运算，无法满足两视图特征的非线性关系运算。

基本概念

典型相关性分析（Canonical Correlation Analysis, CCA）是一种统计方法，用于量化和理解两组变量之间的线性关系。

CCA旨在找到两组变量内的线性组合，使得这些组合之间的相关性最大化。这种方法特别适用于探索不同数据源或测量方式之间的潜在联系。

CCA的基本目标是在两组随机变量 $\mathbf{X}$ 和 $\mathbf{Y}$ 之间寻找一对线性组合，使得它们之间的相关性最大化。这里， $\mathbf{X}$ 和 $\mathbf{Y}$ 可以是任意两个数据集，例如，一个人的身高和体重数据集和这个人跑步和跳远的能力数据集。

CCA的主要公式和解释如下：

给定两组随机变量向量 $\mathbf{X}$ 和 $\mathbf{Y}$ ，其中 $\mathbf{X}\in\mathbb{R}^{p}$ 和 $\mathbf{Y}\in\mathbb{R}^{q}$
CCA试图找到向量 $\mathbf{a}\in\mathbb{R}^{p}$ 和 $\mathbf{b}\in\mathbb{R}^{q}$ ，使得新的变量 $U=\mathbf{a}'\mathbf{X}$ 和 $V=\mathbf{b}'\mathbf{Y}$ 之间的相关性最大。
这里的 $\mathbf{a}'$ 和 $\mathbf{b}'$ 分别表示向量 $\mathbf{a}$ 和 $\mathbf{b}$ 的转置。

CCA的优化目标是：

$\rho = \text{corr}(U, V) = \frac{\text{Cov}(U, V)}{\sqrt{\text{Var}(U)\text{Var}(V)}}$

其中，

$\rho$ 是典型相关系数，表示 $U$ 和 $V$ 之间的相关性。
$\text{Cov}(U, V)$ 是 $U$ 和 $V$ 的协方差。
$\text{Var}(U)$ 和 $\text{Var}(V)$ 分别是 $U$ 和 $V$ 的 方差。

为了简化这个目标，CCA通过求解广义特征值问题来实现。具体来说，CCA试图最大化如下表达式：

$\max_{\mathbf{a}, \mathbf{b}} \frac{\mathbf{a}'\Sigma_{XY}\mathbf{b}}{\sqrt{\mathbf{a}'\Sigma_{XX}\mathbf{a} \cdot \mathbf{b}'\Sigma_{YY}\mathbf{b}}}$

其中，

$\Sigma_{XX}$ 是 $\mathbf{X}$ 的协方差矩阵。
$\Sigma_{YY}$ 是 $\mathbf{Y}$ 的协方差矩阵。
$\Sigma_{XY}$ 和 $\Sigma_{YX}$ 分别是 $\mathbf{X}$ 和 $\mathbf{Y}$ 之间的交叉协方差矩阵。

然而，为了简化计算，通常CCA通过求解以下广义特征值问题来实现：

$\Sigma_{XY}\mathbf{b} = \lambda\Sigma_{YY}\mathbf{b}$
$\Sigma_{YX}\mathbf{a} = \lambda\Sigma_{XX}\mathbf{a}$

其中，

$\lambda$ 是特征值。
$\mathbf{a}$ 和 $\mathbf{b}$ 分别是与最大特征值对应的特征向量，这些向量给出最优的线性组合 $U$ 和 $V$ 。

CCA的一个关键假设是协方差矩阵 $\Sigma_{YY}$ 和 $\Sigma_{XX}$ 是非奇异的。如果矩阵奇异，需要额外的技术来处理这个问题。

在多视图学习中，CCA被用来寻找多个视图之间的线性投影，使得投影后的数据在新的低维空间中保留了视图间的相关性。这种技术在跨模态检索、多视图特征融合等领域有广泛的应用。

不易撞的网名

关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于典型相关性分析的多视图学习方法——典型相关性分析（Canonical Correlation Analysis, CCA）

典型相关性分析（Canonical Correlation Analysis, CCA）是经典的挖掘视图相关性的多视图子空间学习方法[38]，主要是计算两视图特征的最大线性投影，使得在投影空间中，两视图特征的相关性最大。
复制链接

扫一扫