两总体均值和比例的推断
前面对一个总体的均值和比例如何进行区间估计以及假设检验
本文说明如何对两个总体进行区间估计和假设检验
两总体均值之差的推断: σ1 σ 1 和 σ2 σ 2 已知
令 u1 u 1 和 u2 u 2 分别表示总体1和总体2的均值,本节介绍两均值之差: u1−u2 u 1 − u 2 的统计推断
独立简单随机样本:从总体1中抽取一个容量为 n1 n 1 的简单随机样本,从总体2中抽取一个容量为 n2 n 2 的简单随机样本 两个样本是相互独立抽取的
假设两个总体的标准差 σ1 σ 1 和 σ2 σ 2 是已知的,如何计算误差范围以及计算两总体均值之间的区间估计
u1−u2 u 1 − u 2 的区间估计
两个总体均值之差的点估计量 : x¯1−x¯2 x ¯ 1 − x ¯ 2
x¯1−x¯2
x
¯
1
−
x
¯
2
的标准误差:
σx¯1−x¯2=σ21n1+σ22n2−−−−−−−√
σ
x
¯
1
−
x
¯
2
=
σ
1
2
n
1
+
σ
2
2
n
2
两总体均值之差的区间估计:
σ1
σ
1
和
σ2
σ
2
已知:
x¯1−x¯2±zα/2σ21n1+σ22n2−−−−−−−√
x
¯
1
−
x
¯
2
±
z
α
/
2
σ
1
2
n
1
+
σ
2
2
n
2
u1−u2 u 1 − u 2 的假设检验
假设检验的三种形式:上侧检验 下侧检验 双侧检验
实用建议:给出的区间估计与假设检验的大部分应用,随机样本都满足 n1≥30 n 1 ≥ 30 及 n2≥30 n 2 ≥ 30 一旦其中之一的样本容量小于30 总体的分布就需要重点加以考虑
作用:考察两总体样本之间的差异
u1−u2 u 1 − u 2 的假设检验的检验统计量: σ1 σ 1 和 σ2 σ 2 已知 z=(x¯1−x¯2)−D0σ21n1+σ22n2√ z = ( x ¯ 1 − x ¯ 2 ) − D 0 σ 1 2 n 1 + σ 2 2 n 2
两总体均值之差的推断: σ1 σ 1 和 σ2 σ 2 未知
对两总体标准差
σ1
σ
1
和
σ2
σ
2
未知的情形, 将使用样本标准差
s1
s
1
和
s2
s
2
来估计未知的总体标准差
使用样本标准差时,区间估计与假设检验的程序将会建立在
t
t
分布的基础上而非标准正态分布
两个总体均值之差的区间估计:和
σ2
σ
2
未知:
x¯1−x¯2±tα/2s21n1+s22n2−−−−−−√
x
¯
1
−
x
¯
2
±
t
α
/
2
s
1
2
n
1
+
s
2
2
n
2
用样本标准差
s1
s
1
和
s2
s
2
来估计
σ1
σ
1
和
σ2
σ
2
并用
tα/2
t
α
/
2
来代替
zα/2
z
α
/
2
t
t
分布
自由度:两个独立随机样本的分布:
df=(s21n1+s22n2)21n1−1(s21n1)2+1n2−1(s22n2)2
d
f
=
(
s
1
2
n
1
+
s
2
2
n
2
)
2
1
n
1
−
1
(
s
1
2
n
1
)
2
+
1
n
2
−
1
(
s
2
2
n
2
)
2
u1−u2 u 1 − u 2 的假设检验
u1−u2 u 1 − u 2 的假设检验的检验统计量: σ1 σ 1 和 σ2 σ 2 未知: t=(x¯1−x¯2)−D0s21n1+s22n2√ t = ( x ¯ 1 − x ¯ 2 ) − D 0 s 1 2 n 1 + s 2 2 n 2
两总体均值之差的推断:匹配样本
在选择用于搜集生产时间数据及检验假设的抽样方法时,考虑两种方案
1. 独立样本设计:例子 抽取工人的一个简单随机样本 样本中每个工人使用生产方法1;抽取工人的另一个独立的简单随机样本 样本中每个工人使用生成方法2
2. 匹配样本设计:抽取工人的简单随机样本 每个工人先用一种生产方法,然后使用另一种生产方法
在匹配样本设计中,两种生产方法在相似条件下被检验 因此这一设计产生的抽样误差往往要比独立样本设计要小 主要因为在匹配样本设计中 两种生产方法被相同的工人使用 剔除了工人间的差异
匹配样本的样本均值
d¯=∑din
d
¯
=
∑
d
i
n
di
d
i
为方法1和方法2之差
匹配样本的标准差
sd=∑(di−d¯)2n−1−−−−−−−√
s
d
=
∑
(
d
i
−
d
¯
)
2
n
−
1
匹配样本假设检验的检验统计量:
t=d¯−udsd/n√
t
=
d
¯
−
u
d
s
d
/
n
两总体比例之差的推断
令
p1
p
1
表示总体
1
1
的比例,表示总体
2
2
的比例,讨论两总体比例之差的统计推断
为了对这个比例之差做出推断 选择两个独立的随机样本,这两个样本分别总体
1
1
的个单位和总体
2
2
中个单位组成
两总体比例之差的点估计量:
p¯1−p¯2
p
¯
1
−
p
¯
2
p¯1−p¯2
p
¯
1
−
p
¯
2
的标准误差:
σp¯1−p¯2=p1(1−p1)n1+p2(1−p2)n2−−−−−−−−−−−−−−√
σ
p
¯
1
−
p
¯
2
=
p
1
(
1
−
p
1
)
n
1
+
p
2
(
1
−
p
2
)
n
2
如果样本容量足够大 使得
n1p1
n
1
p
1
,
n1(1−p1)
n
1
(
1
−
p
1
)
,
n2p2
n
2
p
2
,
n2(1−p2)
n
2
(
1
−
p
2
)
都大于或等于5,则
p¯1−p¯2
p
¯
1
−
p
¯
2
的抽样分布近似服从于正态分布
两总体比例之差的区间估计: p¯1−p¯2±zα/2p¯1(1−p¯1)n1+p¯2(1−p¯2)n2−−−−−−−−−−−−−−√ p ¯ 1 − p ¯ 2 ± z α / 2 p ¯ 1 ( 1 − p ¯ 1 ) n 1 + p ¯ 2 ( 1 − p ¯ 2 ) n 2
p1−p2 p 1 − p 2 的假设检验
当 p1=p2=p p 1 = p 2 = p 时, p¯1−p¯2 p ¯ 1 − p ¯ 2 的标准误差 : σp¯1−p¯2=p1(1−p1)n1+p2(1−p2)n2−−−−−−−−−−−−−−√=p(1−p)(1n1+1n2−−−−−−−−−−−−−√) σ p ¯ 1 − p ¯ 2 = p 1 ( 1 − p 1 ) n 1 + p 2 ( 1 − p 2 ) n 2 = p ( 1 − p ) ( 1 n 1 + 1 n 2 )
当
p1=p2=p
p
1
=
p
2
=
p
时,
p
p
的合并估计量:
p1−p2
p
1
−
p
2
的假设检验的检验统计量:
z=p¯1−p¯2p(1−p)(1n1+1n2√)
z
=
p
¯
1
−
p
¯
2
p
(
1
−
p
)
(
1
n
1
+
1
n
2
)