目录
简介
典型相关性分析(Canonical Correlation Analysis),研究两组变量(每组变量中都可能又多个指标)之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。
主要思路:把多个变量与多个变量之间的相关化为两个具有代表性的变量之间的相关性,其思想与主成分分析类似。首先在每组变量中找出变量的线性组合使得两组的线性组合具有最大的相关系数;然后选取和最初挑选的这对线性组合不想管的线性组合,使其配对,并选取相关系数最大的一堆。重复以上步骤,知道两组变量之间的相关性被完全提取,即相关性不显著。被选出的线性组合配对称为典型变量,他们的相关系数称为典型相关系数,度量了这两组变量之间联系的强度。
步骤
- 假设两组数据服从联合正态分布
- 对两组变量的相关性进行检验,p值小于0.05或0.1表示在0.95或0.9的置信水平下拒绝原假设,即认为两组变量是有关的
- 确定典型相关变量的个数
- 利用标准化后的典型相关变量分析问题
- 进行典型荷载分析
SPSS操作步骤
- 导入数据
- 数据的类型全部设置为标度
- 点击分析->相关->典型相关
- 将数据移动到相应的集合
- 导出分析结果
- 首先看典型相关性表格的最后一列,通过p值确定典型相关系数的个数
- 根据确定的典型相关系数写出标准化后的典型相关变量
典型相关分析看p值,取p值较小,即具有显著相关性的一组
取具有相助相关性一组的标准化典型相关系数作为典型相关系数。
典型载荷表示典型变量与集合变量中的关系,绝对值越大表明该变量越重要
典型冗余表示典型变量的占比,可以看出哪些组典型变量是多余的,可以剔除