6.4.2分布拟合的卡方检验(续)
例 测得200件混泥土制件的抗压强度,按区间分布如下:
试在
解 这个例子中没有原始数据,我们就用组中值来代替原始数据.
即
我们已经计算过正态分布参数的极大似然估计为
参数的极大似然估计值分别为
进而得到分布函数的估计,而每个区间中概率的估计就是在两区间端点的分布函数值之差,即
列出计算检验统计量的表格
每一类的频数都大于等于5,不需要再进行合并。
现在
所以拒绝域为
对于分布拟合的卡方检验问题,我们想要检验的是总体的分布是否为已知的分布
但实际上我们只检验了总体分布落入给定区间的概率是否与已知分布相同,即
这样即使
- Kolmogorov- Smirnov检验
思想:用经验分布函数取近似总体分布
这样检验问题就转化成
那么当原假设成立的时候,两者之差应该比较小,所以我们取检验统计量为两者之差的最大值
在
因为经验分布是阶梯函数,且已知分布
而无论是哪一种情形,在任何一个区间上,
其拒绝域的形式为
例 检验下面10个数是否来自标准正态总体.
解 取检验统计量为
这里
计算统计量的值如下表
得出此表的过程:
- 首先将数据进行排列,得到各个次序统计量的值
- 将各个次序统计量的值代入
中(这里就是标准正态分布函数)
- 写出各个区间的起止端点
- 得出
,就是与相应区间端点之差的较大者
- 取
中最大的作为检验统计量的值
这里
对这种方法进行推广就得到Smirnov检验:
Smirnov检验的问题是两个总体分布是否相同,那么自然就转化成两个样本的经验分布函数是否相同,即假设为
也是当这个统计量的值比较大是拒绝原假设,拒绝域形式为
如果是单边问题
6.5列联表独立性检验(检验两个特性是否独立)
例 根据男女色盲人数
判断性别与色盲是否独立.
上面这个例子就是检验两个特性(性别与色盲)之间是否独立,其中性别分为男女两类,色盲分为正常与色盲两类.
一般而言,假设两个特性
要检验的是两个特性
下面将独立这个条件转化成具体的含义:
设
当两个特性独立时,根据定义,这些概率应该满足
如果
而当原假设成立的时候,这个统计量近似卡方分布
拒绝域为
如果
所以这时我们选取的检验统计量为
此时自由度为
继续看色盲的例子,选取检验统计量为
现
现利用
然后得到检验统计量的计算表格
因为
解题步骤:
- 构造检验统计量
- 列出理论频数表格
- 列出检验统计量的计算表格
- 判断有无落入拒绝域
另外,在