一.什么是典型相关分析
要研究两组变量(每组变量可以含有多个指标)之间的相关关系的一种多元统计方法,它可以揭示两组变量间内在的联系
我们要在每组变量找到变量的线性组合,并且要求这两组线性组合的方差为1(只有方差为1,才能使相关系数最大)。然后去重复这个步骤,每次都去构造不同的线性组合,且每组第二次构造的线性组合与第一次构造的不相关。直到两组变量的相关性被提取完为止。这样的线性组合叫典型变量,两个典型变量间的相关系数成为典型相关系数。
注意典型变量如果已经够具有代表性就无需继续提取。
二.典型相关分析的思想
对于层次鲜明的变量,就比如要对30个影视剧打分,评价人群有6种:农民、学生、工程师、演员、导演、艺术家。
很显然这六个变量可以分为
业内人士:演员、导演、艺术家
业余人士:农民、学生、工程师
题目要我们去探究业内和业余人士对影视剧评分的相关性程度
那我们就可以利用典型相关分析。
三.典型相关分析的步骤
1.正态分布检验
要想使用典型相关分析,必须要对样本的指标进行正态检验,只有指标数据符合正态分布才可以使用典型相关分析。
2.检查两组变量间是否相关
对于两组随机向量X1和X2,如果X1和X2互不相关那么协方差COV(X1,X2)=0。为检验是否协方差为0,需要进行检验,我们记COV(X1,X2)=。
原假设H0:两个