1. 假设检验的定义
假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。
1.1 假设检验的假设
我们需要对结果进行假设,然后拿样本数据去验证这个假设。做假设检验时会设置两个假设:
- 零假设:零假设(原假设), H 0 H_0 H0是普遍接受的事实; 它与备选假设相反。 研究人员致力于拒绝,废除或反驳零假设。 研究人员提出了一个替代假设,他们认为这个假设解释了一种现象,然后努力拒绝零假设。零假设的设置一般为:等于=、大于等于>=、小于等于<=。
- 备选假设: H 1 H_1 H1是统计者想要接受的假设。备选假设的设置一般为:不等于、大于>、小于<。
1.2 两种错误
通过样本数据来判断总体参数的假设是否成立,但样本时随机的,因而有可能出现小概率的错误。这种错误分两种,一种是弃真错误,另一种是取伪错误。
- 弃真错误:也叫第I类错误或α错误。它是指零假设实际上是真的,但通过样本估计总体后,拒绝了零假设。明显这是错误的,我们拒绝了真实的原假设,所以叫弃真错误,这个错误的概率我们记为α。这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小。
- 取伪错误:也叫第II类错误或β错误。它是指零假设实际上假的,但通过样本估计总体后,接受了原假设。明显这是错误的,我们接受的零假设实际上是假的,所以叫取伪错误,这个错误的概率我们记为β。
为什么一般要拒绝零假设:因为零假设备被拒绝,如果出错的话,只能犯弃真错误(α错误),而犯弃真错误的概率已经被规定的显著性水平(值在假设检验前被规定)所控制了。这样对统计者来说更容易控制,将错误影响降到最小。
1.3 显著性水平
显著性水平是指当原(零)假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率。这个值是我们做假设检验之前统计者根据业务情况定好的。
显著性水平α越小,犯第I类错误的概率自然越小,一般取值:0.01、0.05、0.1等
1.4 检验方式
检验方式分为两种:双侧检验和单侧检验。
- 单侧检验:备选假设带有特定的方向性,分为两种:左侧检验和右侧检验。"<"称为左侧检验, ">"称为右侧检验。
- 双侧检验:备选假设没有特定的方向性,形式为“≠”这种检验假设称为双侧检验
检验统计量:据以对零假设和备选假设作出决策的某个样本统计量,称为检验统计量。
拒绝域
定义:拒绝域是由显著性水平围成的区域
拒绝域的功能主要用来判断假设检验是否拒绝零假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝零假设,否则不拒绝零假设。给定显著性水平α后,查表就可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。
双侧检验拒绝域:
左侧检验拒绝域:
右侧检验拒绝域:
2. 假设检验的步骤
1)提出零假设与备选假设
2)从所研究总体中出抽取一个随机样本
3)构造检验统计量
4)根据显著性水平确定拒绝域临界值
5)计算检验统计量与临界值进行比较
3. 两种假设检验
在总体方差已经知道的情况下,不管样本数量多少都可以选择u检验。而如果总体方差未知,且样本数量小于40,则应该选择t检验。那么如果总体方差未知,但是样本数量超过40了,则u检验和t检验都可以使用,因为样本量大的情况下,t分布趋向于正态分布
3.1 一个总体参数的假设检验
只有一个总体的假设检验。
大小样本:样本量大于等于30的样本称为大样本,样本量小于30的样本称为小样本。
3.1.1 一个总体参数的假设检验:大样本假设检验方法(n>=30):
U检验(Z检验):是基于正态分布的检验
双侧检验:H0 :
μ
=
μ
0
\mu = \mu0
μ=μ0, H1 :
μ
≠
μ
0
\mu \neq \mu0
μ=μ0 ;
左侧检验:H0: μ ≥ μ 0 \mu \geq \mu0 μ≥μ0, H1 : μ < μ 0 \mu < \mu0 μ<μ0;
右侧检验:H0: μ ≤ μ 0 \mu \leq \mu0 μ≤μ0 , H1 : μ > μ 0 \mu > \mu0 μ>μ0 ;
检验统计量:
- 总体标准差
σ
\sigma
σ 已知:
- 总体标准差
σ
\sigma
σ 未知:
x
ˉ
\bar{x}
xˉ: 样本均值
μ
\mu
μ:假设的总体均值
s
s
s:样本标准差
σ
\sigma
σ:总体标准差,当总体标准差已知时,用
σ
\sigma
σ参与计算更精准。
n
n
n:样本量
α
\alpha
α与拒绝域:
双侧检验:
∣
Z
∣
>
Z
α
/
2
|Z|>Z \alpha/2
∣Z∣>Zα/2
左侧检验:
∣
Z
∣
<
−
Z
α
|Z|<-Z \alpha
∣Z∣<−Zα
右侧检验:
∣
Z
∣
>
Z
α
|Z|>Z \alpha
∣Z∣>Zα
P值决策:
P<
α
\alpha
α ,拒绝H0
3.1.2 一个总体参数的假设检验:小样本假设检验方法(n<30):
t检验(总体均值已经知道,但总体方差未知,只知道样本的方差)
3.2 一个总体成数的假设检验
定义:
样本成数:它是指样本中具有某一相同标志表现的单位数占样本容量的比重,记为p.
总体成数:它是指总体中具有某一相同标志表现的单位数占全部总体单位数的比重,一般用π表示.
3.3 两个总体参数的假设检验
3.4 两个总体成数的假设检验
当n1P1、n1(1-P1)、n2P2、n2(1-p2)都大于或等于5时,就可以称为大样本。
假设形式:
双侧检验:H0 : π1-π2 =0 ,H1 : π1-π2≠0
左侧检验:H0 : π1-π2 ≥0 ,H1 : π1-π2<0
右侧检验:H0 : π1-π2 ≤0 ,H1 : π1-π2>0
(1)
原假设为H0: π1=π2 或 π1-π2 ≥0 、π1-π2 ≤0情况下。
其中:
p1、p2:两个样本成数
p:两个样本合并的成数
n1、n2:两个样本量
(2)
原假设为 H0: π1-π2 =d0 (d0≠0)的情况下
α
\alpha
α 与拒绝域:
双侧检验:
∣
Z
∣
>
Z
α
/
2
|Z|>Z \alpha/2
∣Z∣>Zα/2
左侧检验:
∣
Z
∣
<
−
Z
α
|Z|<-Z \alpha
∣Z∣<−Zα
右侧检验:
∣
Z
∣
>
Z
α
|Z|>Z \alpha
∣Z∣>Zα
P值决策:
P<
α
\alpha
α ,拒绝H0