前言
虽然网上也有很多关于方差分析的介绍,但是我还是想结合自己在学校所学的统计学专业知识以及网上的一些优秀文档做一个笔记整理,不为别的,只为以后用到这方面知识的时候有笔记可查,分享到博客也是为了和大家一起学习探究,无其他过分的想法,谢谢各位。
PS:由于markdown编辑器不支持数学公式的直接复制,所以只能先在Word文档编辑好,然后以插图的形式放进来,因此在文章发现有文档的插图请不要奇怪,正常操作 [笑脸]
1 方差分析概述
1.1 方差分析的作用
为了进行两组以上均值的比较,通常可以使用方差分析的方法,也就是说方差分析用于两个及两个以上样本均数差别的显著性检验。在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本下得到较高的农作物产物。这就需要首先分析农作物的产量究竟受到哪些因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥、气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们能够掌握在众多的影响因素中,哪些因素对农作物的产量起了主要的、关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。
1.2 影响因素分类
受不同因素的影响,研究所得的数据会不同。造成结果差异的原因可分成两类:一类是不可控的随机因素的影响,这是人为很难控制的一类影响因素,称为随机变量,在很多情况下,随机因素指的是实验过程中的抽样误差;另一类是研究中人为施加的可控因素对结果的影响,称为控制变量。
1.3 方差分析的基本思想
方差分析的基本思想是:通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有显著的变化;如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大。
1.4 方差分析的分类
根据控制变量的个数,可以将方差分析分成单因素方差分析、多因素方差分析以及协方差分析。单因素方差分析的控制变量只有一个(但一个控制变量可以有多个观察水平),多因素方差分析的控制变量有多个,而协方差分析的控制因素可以是单因素或者多因素,不同的是协方差分析存在协变量(协变量一般为连续型定量变量)。
2 单因素方差分析
2.1 单因素方差分析统计原理
定义:单因素方差分析测试某一个控制变量的不同水平是否给观察变量造成了显著差异和变动。例如,培训是否给学生成绩造成了显著影响;不同地区的考生成绩是否有显著的差异等。
建立原假设H0:控制变量不同水平下观测变量各总体的均值无显著差异。计算检验统计量F值和其相伴概率值,如果相伴概率值小于显著性水平α,则拒绝原假设,认为控制变量不同水平下各总体均值有显著差异;反之,则认为控制变量不同水平下各总体均值没有显著差异。
2.2 实例与SPSS实现过程
研究不同组别的数学成绩是否有显著差异,其三组学生的数学成绩如下:
在SPSS中操作步骤如下:(1)单击菜单Analyze->Compare means->One-Way ANOVA,出现对话框如图1所示:
图1
(2)将观察变量选择到Dependent List框。(3)将控制变量选择到Factor框。控制变量有几个不同的取值表示控制变量有几个水平。(4)单击Options按钮,如图2所示: