一、概念
典型相关分析是研究两组变量(每组变量中有多个指标)之间的相关关系的一种多元统计方法,它能够揭示两组变量之间的内在联系,其核心思想是把多个变量之间的相关关系转化为两个具有代表性的变量之间的关系。
注意:这里的代表指的是能较为综合、全面的衡量所在组内的内在规律。一组变量最简单的综合形式就是该组变量的线性组合。
二、具体定义
典型相关分析有Hltelling提出,其基本思想和主成分分析非常相似。
首先在每组变量中找出变量的线性组合,使得两组线性组合之间具有最大的相关系数
然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对
如此继续下去,直到两组变量之间的相关性被提取完毕为止
被选出的线性组合配对称为典型变量,他们的相关系数被称之为典型相关系数。典型相关系数度量了这两组变量之间的联系的强度
模型思路:
三、典型相关分析的关键步骤
第一步:数据的分布有假设,两组数据服从联合正态分布
第二步:对两组变量的相关性进行检验(构造似然比统计量)
p值小于0.05(0.1)表示在95%(90%)的置信水平下拒绝原假设,即认为两组变量有关
第三步:确定典型相关变量的个数(直接看典型相关系数对应的p值即可)
第四步:利用标准化后的典型相关变量分析问题
第五步:进行典型载荷分析
第六步:计算前r个典型变量对样本总方差的贡献
四、SPSS实现典型相关分析
注意:注意:Spss至少需要24版本,低版本不能直接进行典型相关分析的操作,需要编程。
第一步:导入数据
第二步:检验数据的类型(全部设置为标度类型)
第三步:点击菜单的典型相关分析功能
第四步:将数据移动到对应的集合
第五步:导出分析结果
第六步:对结果进行分析
首先看这张表的最后一列,这一列代表这统计检验量所对应的p值,我们要通过它确定典型相关系数的个数
写出标准化后的典型变量来(根据上面确定的个数来写,有几个显著的典型相关系数就要写出几对来)
典型变量每个分量前面的系数代表这重要程度,可结合典型相关系数进行分析
选择性的分析典型荷载和方差解释程
更多有关于典型相关分析的经典获奖论文和文中代码用到的数据集,关注公众号,回复,“典型相关”,即可免费领取!!!