一、定义
现实生活中有很多数据的取值只有两类,如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。调用SPSS中的二项分布检验(Binomial)可对样本资料进行二项分布分析。
SPSS二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项分布。其零假设是H0:样本来自的总体与所指定的某个二项分布不存在显著的差异。
SPSS中的二项分布检验,在样本小于或等于30时,按照计算二项分布概率的公式进行计算;样本数大于30时,计算的是Z统计量,认为在零假设下,Z统计量服从正态分布。Z统计量的计算公式如下:
SPSS将自动计算Z统计量,并给出相应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α,则应拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布不存在显著差异。
SPSS二项分布检验的数据是实际收集到的样本数据,而非频数数据。
二、实例
某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)是否不同?数据如表10-2所示。
35名婴儿的性别
婴儿 | Sex | 婴儿 | Sex | 婴儿 | Sex |
1 | 1 | 13 | 1 | 25 | 1 |
2 | 0 | 14 | 1 | 26 | 1 |
3 | 1 | 15 | 1 | 27 | 0 |
4 | 1 | 16 | 1 | 28 | 0 |
5 | 1 | 17 | 0 | 29 | 0 |
6 | 1 | 18 | 0 | 30 | 0 |
7 | 0 | 19 | 0 | 31 | 1 |
8 | 0 | 20 | 0 | 32 | 0 |
9 | 0 | 21 | 0 | 33 | 0 |
10 | 0 | 22 | 0 | 34 | 0 |
11 | 1 | 23 | 1 | 35 | 0 |
12 | 1 | 24 | 1 |
检验步骤:
1、卡方检检:http://www.cnblogs.com/downmoon/archive/2012/03/06/2382042.html
2、二项分布检验:http://www.cnblogs.com/downmoon/archive/2012/03/26/2417668.html
3、游程检验:http://www.cnblogs.com/downmoon/archive/2012/03/26/2417882.html