Canonical Correlation Analysis（典型关联分析）

最新推荐文章于 2021-08-04 20:16:37 发布

上杉翔二

最新推荐文章于 2021-08-04 20:16:37 发布

阅读量4.7k

点赞数 4

分类专栏：机器学习

本文链接：https://blog.csdn.net/qq_39388410/article/details/78253917

版权

机器学习专栏收录该内容

24 篇文章 12 订阅

订阅专栏

CCA原理：
关联分析，从线性回归开始！
同样是找样本之间的关系，在线性回归中是找通过拟合找出x和y的关系，当有多个维度时，也是一样找出Y=WX就可以了，但是这样我们会发现一个事实，那就是这个式子所代表的意义是Y的每个特征都于X所有的特征相关联，而它本身之间却没有联系。回归原点，如果将X和Y同等对待，考虑他们之间的相关性可以吗？可以的，Pearson告诉已经了我们：

ρ (X, Y) = c o v ( X , Y ) D ( X ) - - - - - \sqrt D ( Y ) - - - - \sqrt

$\rho(X,Y) = \frac{cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$ 其中cov(X,Y)是X和Y之间的协方差，而D(X),D(Y)是方差。那么最大化这个式子不就可以了？那对于多维的X，Y分别求使它们的W最大就行了，即求

w1x1+w2x2+...wnxn $w_1x_1+w_2x_2+...w_nx_n$ 和

w1y1+w2y2+...wnyn $w_1y_1+w_2y_2+...w_ny_n$ 中的W，为区别起见分别取名为a和b，两个式子分别等于u，v，即

u=aTX,v=bTY $u=a^TX,v=b^TY$ 。那么此时优化的代价函数为：

a r g m a x          a, b c o v ( u , v ) D ( u ) - - - - \sqrt D ( v ) - - - - \sqrt

$\underbrace{arg\;max}_{a,b}\frac{cov(u,v)}{\sqrt{D(u)}\sqrt{D(v)}}$
可以求出u和v的方差，协方差为

D (u) = D (a T X) = 1 n \sum i = 1 n (a T x i - a T E (x i)) 2 = a T E (X X T) a

$D(u) = D(a^TX) =\frac{1}{n}\sum_{i=1}^{n} (a^Tx_i-a^TE(x_i))^2= a^TE(XX^T)a$

D (v) = D (b T Y) = 1 n \sum i = 1 n (b T y i - b T E (y i)) 2 = b T E (Y Y T) b

$D(v) = D(b^TY) =\frac{1}{n}\sum_{i=1}^{n} (b^Ty_i-b^TE(y_i))^2= b^TE(YY^T)b$

c o v (u, v) = c o v (a T X, b T Y) = E ((a T X) (b T Y) T) = a T E (X Y T) b

$cov(u,v) = cov(a^TX, b^TY) = E((a^TX)(b^TY)^T) = a^TE(XY^T)b$
之后带入原式就可以了，所以我们新的代价函数就为：

a r g m a x          a, b a T E ( X Y T ) b a T E ( X X T ) a - - - - - - - - - - \sqrt b T E ( Y Y T ) b - - - - - - - - - \sqrt

$\underbrace{arg\;max}_{a,b}\frac{a^TE(XY^T)b}{\sqrt{ a^TE(XX^T)a}\sqrt{b^TE(YY^T)b}}$
为了避免a和b同时扩大n倍后仍然产生符合条件的解，所以和 SVM一样，固定分母，优化分子，即损失函数变为：

a r g m a x          a, b a T E (X Y T) b

$\underbrace{arg\;max}_{a,b}\;\;{a^TE(XY^T)b}$

s . t . a T E (X X T) a = 1, b T E (Y Y T) b = 1

$s.t. a^TE(XX^T)a =1,\; b^TE(YY^T)b =1$
求解上式有2种方法：

1.拉格拉日：
构造拉格朗日算子：

L = a T E (X Y T) b - λ 2 (a T E (X X T) a - 1) - θ 2 (b T E (Y Y T) b - 1)

$L=a^TE(XY^T)b-\frac{\lambda}{2} (a^TE(XX^T)a-1)-\frac{\theta}{2}(b^TE(YY^T)b-1)$
分别对a，b求导，可得：

λ = θ = a T E (X Y T) b

$\lambda=\theta=a^TE(XY^T)b$
发现竟然和损失函数一样，那么只要找出最大的

λ $\lambda$ 就行了。

2.奇异值分解（Singular Value Decomposition，SVD）

这里写图片描述

CCA应用：
CCA参数说明：
CCA(copy=True, max_iter=500, n_components=2, scale=True, tol=1e-06)

copy=True：是否复制
max_iter=500：迭代数阈值
n_components=2：组成树
scale=True：是否分割数据
tol=1e-06：迭代容忍度

sklearn作CCA：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cross_decomposition import CCA


n = 500
#两种噪音
l1 = np.random.normal(size=n)
l2 = np.random.normal(size=n)

latents = np.array([l1, l1, l2, l2]).T
X = latents + np.random.normal(size=4 * n).reshape((n, 4))
Y = latents + np.random.normal(size=4 * n).reshape((n, 4))

X_train = X[:n // 2]#切分数据集
Y_train = Y[:n // 2]
X_test = X[n // 2:]
Y_test = Y[n // 2:]

#计算相关系数Corr
print("Corr(X)")
print(np.round(np.corrcoef(X.T), 2))
print("Corr(Y)")
print(np.round(np.corrcoef(Y.T), 2))

cca = CCA(n_components=2)
cca.fit(X_train, Y_train)
X_train_r, Y_train_r = cca.transform(X_train, Y_train)
X_test_r, Y_test_r = cca.transform(X_test, Y_test)

plt.scatter(X_train_r[:, 0], X_train_r[:, 1], label="train",
            marker="*", c="b", s=50)
plt.scatter(X_test_r[:, 0], X_test_r[:, 1], label="test",
            marker="*", c="r", s=50)
plt.show()

>
Corr(X)
[[ 1. 0.46 0.02 0.04]
[ 0.46 1. 0.03 -0.06]
[ 0.02 0.03 1. 0.51]
[ 0.04 -0.06 0.51 1. ]]
Corr(Y)
[[ 1. 0.49 -0.07 -0.11]
[ 0.49 1. 0.03 -0.02]
[-0.07 0.03 1. 0.57]
[-0.11 -0.02 0.57 1. ]]

这里写图片描述

上杉翔二

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
Canonical Correlation Analysis（典型关联分析）

CCA原理，应用。关联分析，从线性回归开始！同样是找样本之间的关系，在线性回归中是找通过拟合找出x和y的关系，当有多个维度时，也是一样找出Y=WX就可以了，但是这样我们会发现一个事实，那就是这个式子所代表的意义是Y的每个特征都于X所有的特征相关联，而它本身之间却没有联系。回归原点，如果将X和Y同等对待，考虑他们之间的相关性可以吗？可以的........
复制链接

扫一扫

专栏目录