这周导论课上了解到了主成分分析法,但其实在上课时并未完全理解此方法的做法和目的,于是趁着本次作业的机会,我通过短暂并快乐地学习,希望用此方法对本人高中母校参与的第一次入学考试成绩进行因子分析(SPSS)。
首先,我通过查找文件找到了我高中的入学考试成绩,局部如下:
本次考试参与人数为1785人,参考科目有以上9门。
由于各科数据过于杂乱,我借助软件对各科成绩进行规范性描述处理,得到:
数据,便于后续处理。
接着,我利用SPSS强大的因子模型分析功能对各科数据进行处理,得到以下各项统计结果:
上图有两个指标:第一个是KMO值,一般大于0.7就说明不了之间有相关性了,越大变量相关性越强。第二个是Bartlett球形度检验,P值<0.001。综合两个指标,说明变量之间存在相关性,可以进行因子分析。否则,不能进行因子分析。
前两个成分的特征值都大于1,且累计贡献率=66.421%,说明这两个因子对总体的解释率达到近70%,故可以提取前2个因子。
初始未旋转的因子载荷,显示2个主成分,表中,可观察到成分1对数学、物理、化学、生物、地理的载荷高,说明影响大,成分2对语文、英语、政治、历史的载荷高,说明影响大。结合现实生活不难发现,这两个因子恰好对应着对理科学习的能力和对文科学习的能力,又或许这也可能是当初为什么要分文科理科的原因。
进一步分析 ,现设主成分Y1和Y2为理科能力和文科能力,Y为综合能力。首先我借助主成分载荷矩阵Ui作为上述两个因子输出的窗口。
Ai为成分矩阵中各因子载荷矩阵;
计算得到Ui,
再将矩阵Ui与 向量(Z1(语文)、Z2(数学)。。。Z3(生物))相乘得到Yi;
以2个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重,计算主成分综合模型;根据主成分综合模型即可算出综合主成分值Y,即:
结合数据得到结果:
理科实验班
文科班:
该统计结果基本吻合现实认识,可见本次模型试验相对来说非常成功。
总结和思考
通过本次自己的尝试,我进一步理解了主成分分析法以及统计软件的引用,与此同时,我想是否能通过该方法统计和调查社会人群的日常行为,并对其进行分类,再进行主成分分析,或许能够得到影响被调查对象行为的原因,对人的性格研究有很大的帮助。