深度典型关联分析总结

ouymi

已于 2024-09-12 21:05:45 修改

阅读量1.3k

点赞数 15

分类专栏：典型相关分析文章标签：人工智能深度学习

于 2024-09-11 21:10:58 首次发布

本文链接：https://blog.csdn.net/minou/article/details/142149086

版权

典型相关分析专栏收录该内容

1 篇文章

订阅专栏

深度典型相关分析总结

典型相关分析（Canonical Correlation Analysis，CCA）
深度典型相关分析（Deep Canonical Correlation Analysis， DCCA）

典型相关分析（Canonical Correlation Analysis，CCA）

基础知识https://www.cnblogs.com/pinard/p/6288716.html
对于上面这篇文章对于降维是降到1维，即假设X,Y都有n个样本 $[x_1, x_2, x_3, ..., x_n] x_i \in R^{n_1}, y = [y_1, y_2, y_3, .... y_n] y_i\in R^{n_2}$ 通过投影向量a，b投影到1维即
$[x'_1, x'_2, x'_3, ....x'_n], x'_i\in R^1, Y' = [y'_1, y'_2, y'_3, ....y'_n], y'_i\in R^1$ 此时可以通过奇异值分解或者特征值分解去求最大的相关性系数，此时如果投影到o维， $[a_1, a_2,....a_o]^T, a_i \in R^n$ ，B也同理。此时该目标函数就可以写为 $maximize: tr(A^T S_{xy}B)\\subjectto: A^TS_{xx}A=B^TS_{yy}B=I$
这里沿用了上面文章的符号即S代表协方差，同时计算相关性系数的时候就选取top-o个奇异值的和

深度典型相关分析（Deep Canonical Correlation Analysis， DCCA）

深度典型相关分析呢是采用神经网络来代替投影过程，（这里采用的图片和说法都来自论文Deep Canonical Correlation Analysis）
网络结构
当输入的数据 $\in R^{n*d1}$ 输出为o维即 $\in R^{n*o}$ ,Y也同理。此时在去计算CCA得到的值就是top-o个奇异值的和这里的目标函数使用的是 $\theta_1, \theta_2)=argmax_{ ( \theta_1, \theta_2)} corr(f_1(X;\theta_1), f_2(Y; \theta_2))$ $\theta$ 是指网络模型的参数，论文采取奇异值解法令 $S^{-1/2}_{xx}S_{xy}S^{-1/2}_{yy}$
$corr(X', Y') = ||T||_{tr} = tr(T'T)^{-1/2}$
为什么求T的奇异值要这么算因为，A’A 的迹等于A 的奇异值的平方和。详见https://zhuanlan.zhihu.com/p/29846048