1、作用
典型相关分析是研究多个变量和多个变量之间的线性相关关系,能够揭示出两组变量之间的内在联系。首先在每组变量中找到变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的那一组。如此继续配对,直到两组变量之间的相关性被提取完。
2、输入输出描述
输入:集合 Y 为至少两项或以上的定量变量或有序定类变量,集合 Y 为至少两项或以上的定量变量或有序定类变量。
输出:成对典型变量的相关性,以及典型变量对研究变量的解释比例。
3、案例示例
研究200名大学生四个学术得分变量与三个心理得分变量之间的关系。
4、建模步骤
我们假设两个变量的集合 X 和 Y :
定义两个线性关系的集合 U 和 V ,U 是 X 的线性组合,V 是 Y 的线性组合:
我们希望找到使得在每一对和中关联关系最大的线性组合。
定义 的方差如下:
定义 的方差计算如下:
最后 和 的协方差计算如下:
我们采用如下方式来判断 和 的相关性:
我们的目的就是要让上式最大化 。我们想找到关于 X 和 Y 的线性组合,使他们上述的关联关系最大化。这个函数优化一般有两种方法,第一种是奇异值分解 SVD,第二种是特征分解,两者得到的结果一样。