一、spss操作(spss25)
导入数据选择典型相关性
打开输出面板,选择导出
在word中对表格进行修改分析
1.变量指标说明:
Canonical Correlations Settings | |
指标 | 变量 |
Set 1 观众评分指标 | led hed net |
Set 2 业内评分指标 | arti com man |
2.典型相关系数
Canonical Correlations | |||
相关系数 | P值 | ||
1 | .995 | .000 | |
2 | .953 | .000 | |
3 | .637 | .000 |
p值都为0,小于0.05,拒绝原假设,可以认为两组变量之间存在相关性,且三对典型变量的相关性均是显著的。
典型相关系数分别为:,, 。
3.第一组变量标准化典型相关变量对应的线性组合系数
Set 1 Standardized Canonical Correlation Coefficients | |||
Variable | 1 | 2 | 3 |
led | .149 | -.786 | -1.212 |
hed | .977 | .383 | -.160 |
net | -.052 | -.312 | 1.467 |
4.第一组变量标准化典型相关变量对应的线性组合系数
Set 2 Standardized Canonical Correlation Coefficients | |||
Variable | 1 | 2 | 3 |
arti | .858 | .911 | -1.983 |
com | .019 | -1.046 | -1.114 |
man | .145 | -.337 | 2.833 |
得到典型相关系数向量:
得到标准化的典型变量:
其中,和分别为原始变量和标准化后的结果。
以上结果说明观众评分的第一组典型变量与低学历的相关系数为0.1491,与高学历的相关系数为0.977,与网络的相关系数为-0.052.业内人士评分的第一组典型变量与艺术家的相关系数为0.858,与发行的相关系数为0.019,与部门主管的相关系数为0.145,同理我们也可以得到第二组、第三组。
5.(典型冗余分析)观众评分典型载荷
Set 1 Canonical Loadings | |||
Variable | 1 | 2 | 3 |
led | .333 | -.925 | -.185 |
hed | .993 | .101 | .057 |
net | .383 | -.753 | .535 |
6.业内人士评分典型载荷
Set 2 Canonical Loadings | |||
Variable | 1 | 2 | 3 |
arti | .997 | .065 | -.043 |
com | .571 | -.811 | -.126 |
man | .922 | -.274 | .273 |
从另一方面说明观众评分的第一对典型变量与低学历、高学历、网络调查均成正的线性相关关系。其中与高学历的相关性最强。业内人士的第一对典型变量与艺术家、发行、部门主管也都为正的线性相关关系。其中与艺术家、部门主管的线性相关关系比较强,同理可以得到第二组、第三组。
7.已解释方差的比例
Proportion of Variance Explained | ||||
Canonical Variable | Set 1 by Self | Set 1 by Set 2 | Set 2 by Self | Set 2 by Set 1 |
1 | .415 | .411 | .723 | .717 |
2 | .478 | .434 | .246 | .223 |
3 | .108 | .044 | .031 | .012 |
可以看出观众评分样本方差由自身3个典型变量解释的方差比例为:0.415、0.478、0.108,前两个典型变量已解释方差的比例达到0.415+0.478=0.893,同样的方法可以求得业内人士评分方差由自身的3个典型变量解释的方差比例分别为:0.723、0.246、0.031,前两个典型变量已解释方差的比例达到0.723+0.246=0.969 。所以我们可以根据前两组变量(说明只需要前两个变量就行,写论文的时候放在前面)得到典型相关分析的结果:
二、论文写作模板
2.1基本原理
首先假设:、是两个相互关联的随机向量,分别在两组变量中选取若干有代表性的综合变量、,使得每一个综合变量是原变量的线性组合,即
为了确保典型变量的唯一性,我们只考虑方差为1的、的线性函数与,求使得它们相关系数达到最大的这一组。若存在常向量,,在的条件下,使得达到最大,则称、是,的第一对典型相关变量。求出第一对典型相关变量之后,可以类似的求出各对之间互不相关的第二对、第三对等典型相关变量。这些典型相关变量就反映了,之间的线性相关情况。
2.2基本步骤
设服从正态分布,从该总体中抽取样本容量为的样本,得到下列数据矩阵:
然后对样本数据进行标准化处理,则样本的相关系数矩阵为:
(csdn的latex无法识别代码,因此这个矩阵没有设置分割线,在latex中可以复制如下代码得到)
\left[\begin{array}{c;{1pt/3pt}c}
\dot{R_{11}} & \dot{R_{12}}\\
\hdashline[3pt/1pt]
\dot{R_{21}} & \dot{R_{22}}\\
\end{array}\right]
\end{gather*}
由此可得矩阵A和B的样本估计:
求解和的特征根及对应的特征向量,即可得到典型变量及典型相关系数。最终genuine典型相关系数得到我们的典型相关分析表达式。
两组变量指标:(之后的即是分析spss得到的数据表格,上一个目录)