1.简介
研究两组变量(每组变量中都可能有多个指标) 之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。
2.模型
(1)定义
典型相关分析由Hotelling提出,其基本思想和主成分分析非常相似。 首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数; 然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对; 如此继续下去,直到两组变量之间的相关性被提取完毕为止。 被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之 间联系的强度。
(2)思路
设两组变量:
分别在两组变量中选取若干综合变量U,V代表原变量的线性组合:
注:综合变量组数未知,可能一组就能反应大部分的整体信息,一组即可。
为了保证后面组的信息有效,要求组之间不相关:
第一要满足条件:
目的消除量纲影响,
(3)步骤
具体步骤参考[1]。
STEP1:假设联合正态分布
STEP2:相关性检验(构造似然比统计量 )
首先要对两组变量的相关性进行检验(构造似然比统计量 )
STEP3:典型相关变量的个数
STEP4:标准化典型相关变量分析
STEP5:典型载荷分析
STEP6:前 r个典型变量对样本总方差的贡献
3.REFERENCE
[1]. 厦门大学多元统计分析 第九章典型相关分析.ppt