看文章《科学学研究》2010年8月一片文章时,看到典型相关分析的研究,顿时傻了,过去没学过啊。看别人还是用spss做的统计分析就更傻了,好像没哪个老师讲过这个分析。有点云里雾里。还是赶紧学习一下吧。最后那个sas的例题我想大概反复看三篇才能懂。
1. 典型相关分析的基本思想 Canonical Correlation Analysis
简单相关系数(即普通回归方法)描述两组变量的相关关系的缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。典型相关是简单相关、多重相关的推广。典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。
1936年,Hotelling提出典型相关分析。考虑两组变量的线性组合, 并研究它们之间的相关系数p(u,v).在所有的线性组合中, 找一对相关系数最大的线性组合, 用这个组合的单相关系数来表示两组变量的相关性, 叫做两组变量的典型相关系数, 而这两个线性组合叫做一对典型变量。在两组多变量的情形下, 需要用若干对典型变量才能完全反映出它们之间的相关性。下一步, 再在两组变量的与u1,v1不相关的线性组合中, 找一对相关系数最大的线性组合, 它就是第二对典型变量, 而且p(u2,v2)就是第二个典型相关系数。这样下去, 可以得到若干对典型变量, 从而提取出两组变量间的全部信息。
2.典型相关分析的适用范围
为了研究两组变量的关系,如果在理论上能解释谁是自变量,谁是因变量,自然就做路径分析(最好用Lisrel或者Amos等软件,用SPSS应该不够科学)。
如果不能辨别两组变量谁是是自变量,谁是因变量,那再用回归就不恰当的,有一种多对多的相关可以使用,那就是典型相关Canonical correlation
1. 典型相关分析的基本思想 Canonical Correlation Analysis
简单相关系数(即普通回归方法)描述两组变量的相关关系的缺点:只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。典型相关是简单相关、多重相关的推广。典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。
1936年,Hotelling提出典型相关分析。考虑两组变量的线性组合, 并研究它们之间的相关系数p(u,v).在所有的线性组合中, 找一对相关系数最大的线性组合, 用这个组合的单相关系数来表示两组变量的相关性, 叫做两组变量的典型相关系数, 而这两个线性组合叫做一对典型变量。在两组多变量的情形下, 需要用若干对典型变量才能完全反映出它们之间的相关性。下一步, 再在两组变量的与u1,v1不相关的线性组合中, 找一对相关系数最大的线性组合, 它就是第二对典型变量, 而且p(u2,v2)就是第二个典型相关系数。这样下去, 可以得到若干对典型变量, 从而提取出两组变量间的全部信息。
2.典型相关分析的适用范围
为了研究两组变量的关系,如果在理论上能解释谁是自变量,谁是因变量,自然就做路径分析(最好用Lisrel或者Amos等软件,用SPSS应该不够科学)。
如果不能辨别两组变量谁是是自变量,谁是因变量,那再用回归就不恰当的,有一种多对多的相关可以使用,那就是典型相关Canonical correlation