相关矩阵表
各个变量之间存在着较强的相关关系,
如果直接对其进行分析的话,
有可能产生严重的共线
性的问题,所以,就有必要对其进行主成分分析。上面表中的空格表明自身相关系数为
1
,
它的不相关的显著性概率为
0
,也就不再显示出来了。
变量共同度
上面表中所显示出来的变量的共同度对所有的变量都是
1
,
说明这个模型解释了每一个变量
的全部的方差,然而就不需要特殊因子了,也就是说特殊因子的方差为
0
。
解释总方差表
根据上面解释总方差表的显示,
我们可以知道表中所列出的所有的主成分,
他们是按照特征
根从大到小的顺序排列的。可以得知,第一个主成分的特征根是
4.625
,它解释了总变异的
77.084%
;
第二个主成分的特征根是
0.793
,
虽然它解释了总变异的
13.220%
,
但是由于它的
特征根
0.793
远小于
1
,这就说明了第二主成分的解释力度还不如直接引进原始的变量大。
所以,根据主成分的个数的确定原则,也就是累积方差贡献率达到
80%~85%
以上并且要求特
征值要大于
1
这两个原则才可以,就确定了这
6
个变量所需要提取一个主成分。
碎石图
碎石图其实就是按照特征根大小排列的主成分散点图,
如上图所示的,
第一主成分的特征根
大于
1
,从第二个主成分开始特征根都比较偏低,然而特征根小于
1
,就可以看做第一个主
成分能够概括绝大部分的信息。
因子载荷矩阵
从上面表中的因子载荷矩阵可以看出,
标准化的原始的变量可以利用求得的主成分来线性表
示出来,
它的近似的表示可以根据上面表中的数据写出来。
以
price
为例,
现在本实验中只
有一个主成分,可以用
prin
来表示这个主成分,得到如下所示的表达式子:
Price=0.958prin
另外,
运用以上的系数矩阵,
可以得到利用各个原始变量写出来的因子表达式,
方法就是运
用上面表中第
i
列向量除以第
i
个特征根的算术平方根以后,
得到的第
i
个主成分的变量系
数向量,具体写出来的表达式如下所示:
Prin=0.445*zprice+0.448*zpay+0.357*zincome+0.381*zdensity+0.422*zcost+0.389*zpu
rchase