典型相关分析

是什么

典型关联分析(Canonical Correlation Analysis,以下简称CCA)是最常用的挖掘数据关联关系的算 法之一。比如我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力和跳远 能力的数据。那么我们能不能说这两组数据是相关的呢? CCA可以帮助我们分析这个问题。

原理

假设两组变量分别为:

X ( 1 ) = ( X 1 ( 1 ) , X 2 ( 1 ) , ⋯   , X p ( 1 ) ) , X ( 2 ) = ( X 1 ( 2 ) , X 2 ( 2 ) , ⋯   , X q ( 2 ) ) X^{(1)}=\left(X_{1}^{(1)}, X_{2}^{(1)}, \cdots, X_{p}^{(1)}\right), X^{(2)}=\left(X_{1}^{(2)}, X_{2}^{(2)}, \cdots, X_{q}^{(2)}\right) X(1)=(X1(1),X2(1),,Xp(1)),X(2)=(X1(2),X2(2),,Xq(2))

分别在两组变量中每个指标选取适当的权值参数得到 U i 、 V i , U_{i} 、 V_{i} , UiVi,使得每一个综合变量是原变量的线性组合, 即

U i = a 1 ( i ) X 1 ( 1 ) + a 2 ( i ) X 2 ( 1 ) + ⋯ + a p ( i ) X p ( 1 ) ≜ a ( i ) X ( 1 ) V i = b 1 ( i ) X 1 ( 2 ) + b 2 ( i ) X 2 ( 2 ) + ⋯ + b q ( i ) X q ( 2 ) ≜ b ( i ) X ( 2 ) \begin{array}{l} U_{i}=a_{1}^{(i)} X_{1}^{(1)}+a_{2}^{(i)} X_{2}^{(1)}+\cdots+a_{p}^{(i)} X_{p}^{(1)} \triangleq \mathbf{a}^{(i)} \mathbf{X}^{(1)} \\ V_{i}=b_{1}^{(i)} X_{1}^{(2)}+b_{2}^{(i)} X_{2}^{(2)}+\cdots+b_{q}^{(i)} X_{q}^{(2)} \triangleq \mathbf{b}^{(i)} \mathbf{X}^{(2)} \end{array} Ui=a1(i)X1(1)+a2(i)X2(1)++ap(i)Xp(1)a(i)X(1)Vi=b1(i)X1(2)+b2(i)X2(2)++bq(i)Xq(2)b(i)X(2)

注意: 综合变量的组数是不确定的也就是存在多组 { U i , V i } \{U_i,V_i\} {Ui,Vi}, 但是如果第一组就能代表原样本数据大部分的信息, 那么一组就足够了。假设第一组反映的信息不够, 我们就需要找第二组了。并且为了让第二组的信息更有效, 需要保证两组的信息不相关(我的理解:说明在之前这组生成的综合变量之间没有很好的反应总体数据的特征,所以要想与之垂直度方向上进行新的综合变量求解)。

不相关所满足的条件就是:

cov ⁡ ( U 1 , U 2 ) = cov ⁡ ( V 1 , V 2 ) = 0 \operatorname{cov}\left(U_{1}, U_{2}\right)=\operatorname{cov}\left(V_{1}, V_{2}\right)=0 cov(U1,U2)=cov(V1,V2)=0

详细证明过程戳这里

步骤

SPSS生成

在这里插入图片描述
在这里插入图片描述

数据解释

显著性

显著性:就是当显著性值<0.01,时表明有百分之九十九的把握使两组变量存在线性关系,<0.1,就是有百分之九十把握,第二组值0.949,说明根本没有把握说有线性关系,所以舍去,保留第一个。
在这里插入图片描述

特征向量

根据显著性表明只有第一组数据有用,其他舍弃,所以:

集合1保留:0.775, -1.579 ,0.059 作为集合一的系数
集合2保留:0.349, 1.054 ,-0.7516 作为集合一的系数

另外一般只使用标准化的数据进行计算,可以粗略的说明指标对于集合的影响程度,但是不能说就是影响比重或正负影响,要是更加直观的看出真实相关权重要使用荷载分析。
在这里插入图片描述

典型荷载分析

这里的数据值直接可以说明指标对于集合总体的贡献程度,正或负的贡献度。

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

「 25' h 」

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值