我们已经知道,
两个随机变量间的相关关系可以用简单相关系数表示,
一个随机
变量和多个随机变量的相关关系可以用复相关系数表示,
而如果需要研究多个随
机变量和多个随机变量间的相关关系,则需要使用典型相关分析。
典型相关分析由于研究的是两组随机变量之间的相关关系,
因此也属于一种多元
统计分析方法,
多元统计分析方法基本上都有降维的思想,
典型相关分析也不例
外,
它借用主成分分析的思想,
在多个变量中提取少数几个综合变量,
将研究多
个变量间的相关关系转换为研究几个综合变量的相关关系。
典型相关分析首先在每组变量中寻找线性组合,
使其具有最大相关性,
然后再继
续寻找在每组中寻找线性组合,
使其在和第一次寻找的线性组合不相关的条件下,
具有最大相关性,
如此继续,
直到两组变量的相关性被提取完为止,
这些被提取
的变量就是综合变量,
也称为典型变量,
第一对典型变量之间的相关系数称为第
一典型相关系数,
和其他多元分析一样,
一般提取
2-3
对典型变量,
就可以充分
概括样本信息。
看一个例子
我们现在想分析体力与运动能力的关系,随机抽取了
38
人,收集了与体力有关
的
7
项指标,与运动能力有关的
5
项指标,数据如下
SPSS
对于典型相关分析没有专门的过程,而是需要调用专门的宏程序来加以完
成,该程序名为
Canonical correlation.sps
,在按照
SPSS
的时候默认安装在
Sample
文件夹中