假设检验

假设检验

1、概述

  假设检验分为参数假设检验非参数假设检验,参数假设检验是对总体分布函数中的未知参数提出某种假设,然后利用样本提供的信息对所提出的假设进行检验,根据检验的结果对所提出的假设做出拒绝或接受的判断。
  非参数假设检验是对总体分布函数的形式或总体的性质提出某种假设进行的检验。

1.1 假设检验的基本思想与基本概念

例3.1.1 某车间生产的滚球直径服从正态分布 N ( 15.1 , 0.05 ) N(15.1,0.05) N(15.1,0.05)。现从今天生产的滚球中随机抽取6个,测得的直径为
14.6 , 15.1 , 14.9 , 14.8 , 15.2 , 15.1 14.6, 15.1, 14.9, 14.8, 15.2, 15.1 14.6,15.1,14.9,14.8,15.2,15.1
假定方差不变,问今天生产的滚球是否符合要求?即是否可以认为今天生产的滚球的平均直径为15.1?
分析:

  • 第一步:提出原假设和备择假设
    记原始正态分布的均值和方差为 a 0 = 15.1 , σ 2 = 0.05 a_0=15.1, \sigma^2=0.05 a0=15.1,σ2=0.05今天生产的滚球直径 ξ ∼ N ( a , 0.05 ) \xi\sim N(a,0.05) ξN(a,0.05),我们所要回答的问题是 a = a 0 ? a=a_0? a=a0?吗?
    我们可以假设 a = a 0 a=a_0 a=a0,并称假设 a = a 0 a=a_0 a=a0为原假设或零假设,记为:
    H 0 : a = a 0 (1) H_0: a=a_0\tag{1} H0:a=a0(1)
    这种原假设可能成立也可能不成立。当原假设不成立时,称 a a a的取值为备选假设,本例取 " a ≠ a 0 " "a\neq a_0" "a=a0"为备选假设,记为
    H 1 : a ≠ a 0 H_1:a\neq a_0 H1:a=a0
  • 第二步:构造检验量
    如果原假设 H 0 H_0 H0成立?可得到 a = a 0 a=a_0 a=a0, 因为 ξ ˉ 是 a 的 有 效 估 计 \bar\xi是a的有效估计 ξˉa. 则可以得到 ξ ˉ \bar\xi ξˉ应该与 a 0 a_0 a0很靠近,即 ∥ ξ ˉ − a 0 ∥ \|\bar\xi-a_0\| ξˉa0应该很小, 否则, 就不能认为 H 0 H_0 H0成立.
    我们构造的检验量:
    当 ∥ ξ ˉ − a 0 ∥ > C 时 , 我 们 拒 绝 H 0 (2) 当\|\bar\xi-a_0\|>C时, 我们拒绝H_0\tag{2} ξˉa0>C,H0(2)
    当 ∥ ξ ˉ − a 0 ∥ ≤ C 时 , 我 们 不 能 拒 绝 H 0 当\|\bar\xi-a_0\|\leq C时,我们不能拒绝H_0 ξˉa0C,H0
  • 第三步: 确定拒绝域
    我们选择 C = C 0 C=C_0 C=C0, 则 H 0 H_0 H0的拒绝域为(记为 χ 0 \chi_0 χ0)
    χ 0 = ∣ ξ ˉ − a 0 ∣ > C 0 ⇒ ∣ U ∣ > n C 0 σ 0 \begin{aligned} \chi_0&={|\bar\xi-a_0|>C_0}\\ &\Rightarrow|U|>\frac{\sqrt{n}C_0}{\sigma_0} \end{aligned} χ0=ξˉa0>C0U>σ0n C0
    其中, U = ξ ˉ − a 0 σ 0 / n ∼ N ( 0 , 1 ) U=\frac{\bar\xi-a_0}{\sigma_0/\sqrt{n}}\sim N(0,1) U=σ0/n ξˉa0N(0,1)
    说明: ξ ∼ N ( a 0 , σ 0 2 ) \xi\sim N(a_0,\sigma_0^2) ξN(a0,σ02), 则 ξ ˉ ∼ N ( a 0 , σ 0 2 / n ) \bar\xi\sim N(a_0, \sigma_0^2/n) ξˉN(a0,σ02/n)
    由于公式(1)和公式(2):
    α = P { 拒 绝 H 0 ∣ H 0 为 真 } = P 0 { ∥ ξ ˉ − a ∥ > C ∣ a = a 0 } = P 0 { ∥ U ∥ > n C σ 0 } = 2 [ 1 − Φ ( n C σ 0 ) ] \begin{aligned} \alpha&=P\{拒绝H_0|H_0为真\}\\ &=P_0\{\|\bar\xi-a\|>C|a=a_0\}\\ &=P_0\{\|U\|>\frac{\sqrt nC}{\sigma_0}\}\\ &=2[1-\Phi(\frac{\sqrt nC}{\sigma_0})] \end{aligned} α=P{H0H0}=P0{ξˉa>Ca=a0}=P0{U>σ0n C}=2[1Φ(σ0n C)]
    可得出:
    Φ ( n C σ 0 ) = 1 − α 2 \Phi(\frac{\sqrt nC}{\sigma _0})=1-\frac{\alpha}{2} Φ(σ0n C)=12α
    其中 Φ ( x ) \Phi(x) Φ(x)为标准正态分布函数, 因为 α \alpha α为已知数, 所以查标准正态分布函数表, 可得其下侧 1 − α / 2 1-\alpha/2 1α/2分位数 u 1 − α 2 u_{1-\frac{\alpha}{2}} u12α, 使得
    Φ ( u 1 − α 2 ) = 1 − α 2 \Phi(u_{1-\frac{\alpha}{2}})=1-\frac{\alpha}{2} Φ(u12α)=12α
    从而:
    n C σ 0 = u 1 − α 2 \frac{\sqrt nC}{\sigma_0}=u_{1-\frac{\alpha}{2}} σ0n C=u12α
    故:
    C = σ 0 u 1 − α 2 n C=\frac{\sigma_0u_{1-\frac{\alpha}{2}}}{\sqrt n} C=n σ0u12α
    于是得到拒绝域:
    χ 0 = { ∥ ξ ˉ − a 0 ∥ > σ 0 u 1 − α 2 n } = { ∥ ξ ˉ − a 0 σ 0 / n ∥ > u 1 − α / 2 } (3) \begin{aligned} \chi_0&=\{\|\bar\xi-a_0\|>\frac{\sigma_0u_{1-\frac{\alpha}{2}}}{\sqrt n}\}\\ &=\{\|\frac{\bar\xi-a_0}{\sigma_0/\sqrt n}\|>u_{1-\alpha/2}\} \end{aligned}\tag{3} χ0={ξˉa0>n σ0u12α}={σ0/n ξˉa0>u1α/2}(3)
  • 第四步: 带入数值计算,判断是否拒绝.
    例子中, a 0 = 15.1 , ξ ˉ = 14.95 , σ 0 = 0.05 , n = 6 , 取 α = 0.05 , u 1 − α / 2 = 1.96 a_0=15.1, \bar\xi=14.95, \sigma_0=0.05, n=6, 取\alpha=0.05, u_{1-\alpha/2}=1.96 a0=15.1,ξˉ=14.95,σ0=0.05,n=6,α=0.05,u1α/2=1.96带入公式(3)可得:
    ∥ ξ ˉ − a 0 σ 0 / n ∥ = ∥ 14.95 − 15.1 0.05 / 6 ∥ = 1.64317 < 1.96 = u 1 − α / 2 \begin{aligned} \|\frac{\bar\xi-a_0}{\sigma_0/\sqrt n}\|&=\|\frac{14.95-15.1}{0.05/\sqrt 6}\|\\ &=1.64317<1.96=u_{1-\alpha/2} \end{aligned} σ0/n ξˉa0=0.05/6 14.9515.1=1.64317<1.96=u1α/2
    在拒绝域之外, 所以不拒绝 H 0 H_0 H0, 即认为这天生产的滚球平均直径为15.1

一类错误和二类错误
α = P { 犯 第 一 类 错 误 } = P { 拒 绝 H 0 ∣ H 0 为 真 } β = P { 犯 第 二 类 错 误 = P { 接 受 H 0 ∣ H 0 为 假 } } \alpha=P\{犯第一类错误\}=P\{拒绝H_0|H_0为真\}\\ \beta=P\{犯第二类错误=P\{接受H_0|H_0为假\}\} α=P{}=P{H0H0}β=P{=P{H0H0}}
我们当然希望两种错误的概率 α 和 β \alpha和\beta αβ都尽可能的小, 最好都为0. 但是当样本容量n固定时, 要使 α , β \alpha, \beta α,β同时变小是不可能的. 当 α \alpha α变小时, 意味着接受域变大, 这将导致 β \beta β变大;反之,当 β \beta β变小时, 意味着否定域变小, 这又导致 α \alpha α变小.
在实际问题中,通常的做法是,先限制犯第一类错误的概率 α \alpha α, 即根据实际情况, 指定一个较小的数(如0.05, 0.01, 0.001等)作为 α \alpha α的值, 有了 α \alpha α的值就可以确定上述的C. 从而可确定拒绝域. 然后再利用备选假设 β \beta β的值, 如果 β \beta β的值太大, 则需增大样本容量n使 β \beta β变小. 如果实际情况不需要 β \beta β太小,则可考虑适当减小n, 以节省人力, 物力和时间.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值