概率论与数理统计教程(七)-假设检验01:假设检验的基本思想与概念

假设检验是统计学中用于判断假设是否正确的关键方法,起源于20世纪初。通过实例,如女士品茶试验,介绍了如何运用假设检验判断某女士是否有鉴别奶茶的能力。在假设检验中,原假设与对立假设是核心,通过选择统计量和确定显著性水平来判断结果。在给定显著性水平下,根据统计量落入拒绝域的情况作出接受或拒绝原假设的决策。p值提供了一种比较观测结果与不同显著性水平下决策的统一方法,帮助做出更为精确的判断。
摘要由CSDN通过智能技术生成

第七章
假设检验
统计推断的另一个主要内容是 (统计) 假设检验 (hypothesis test).
在这一章里我们将讨论 (统计) 假设的建立及其各种检验.
假设检验是由 K. 皮尔逊(K.Pearson)于 20 世纪初提出的,
之后由费希尔进行了细化, 并最终由奈曼 (Neyman) 和 E. 皮尔逊 (E.Pearson)
提出了较完整的假设检验理论.
§ 7.1 假设检验的基本思想与概念
7.1.1 假设检验问题
先从一个实例来考察假设检验的基本思想.
例 7.1.1 (女士品茶试验)一种奶茶由牛奶与茶按一定比例混合而成,
可以先倒茶后倒奶 (记为 TM), 也可以反过来 (记为 MT).
某女士声称她可以鉴别是 TM 还是 MT, 周围品茶的人对此产生了议论,
“这怎么可能呢?” “她在胡言乱语.” "不可想象."在场的费希尔也在思索这个问题,
他提议做一项试验来检验如下假设 (命题) 是否可以接受:
假设 H H H : 该女士无此种鉴别能力.
他准备了 10 杯调制好的奶茶, TM 与 MT 都有. 服务员一杯一杯地奉上,
让该女士品尝,说出是 TM 还是 MT, 结果那位女士竟然正确地分辨出 10
杯奶茶中的每一杯. 这时该如何对此作出判断呢?
费希尔的想法是: 假如假设 H H H 是正确的, 即该女士无此种鉴别能力, 她只能猜,
每次猜对的概率为 1 / 2 , 10 1 / 2,10 1/2,10 次都猜对的概率为 2 − 10 < 0.001 2^{-10}<0.001 210<0.001,
这是一个很小的概率, 在一次试验中几乎不会发生, 如今该事件竟然发生了,
这只能说明原假设 H H H 不当, 应予以拒绝, 而认为该女士确有辨别奶茶中 TM 与
MT 的能力. 费希尔用试验结果对假设 H H H
的对错进行判断的思维方式可归纳如下:
假如试验结果与假设 H H H 发生矛盾就拒绝原假设 H H H, 否则就接受原假设.
当然, 实际操作远非这么简单, 假如该女士说对了 9 杯 (或 8 杯等),
又该如何对 H H H作出判断呢? 判断会发生错误吗? 发生错误的概率是多少?
能被控制吗? 这里还有很多细节需要研究, 费希尔对这些细节作了周密的研究,
提出一些新的概念,
建立一套可行的方法,形成假设检验理论,为进一步发展假设检验理论与方法打下了牢固基础.
本章将详细讨论其中基础和实用部分, 进一步结果可参阅文献 [15].
下面再用一个实例引出假设检验中的一些基本概念和操作步骤.
例 7.1.2 某厂生产的合金强度服从正态分布 N ( θ , 16 ) N(\theta, 16) N(θ,16), 其中 θ \theta θ
的设计值为不低于 110   P a 110 \mathrm{~Pa} 110 Pa. 为保证质量,
该厂每天都要对生产情况做例行检查,
以判断生产是否正常进行,即该合金的平均强度是否不低于 110   P a 110 \mathrm{~Pa} 110 Pa.
某天从生产的产品中随机抽取 25 块合金, 测得其强度值为
x 1 , x 2 , ⋯   , x 25 x_{1}, x_{2}, \cdots, x_{25} x1,x2,,x25, 均值为 x ˉ = 108.2   P a \bar{x}=108.2 \mathrm{~Pa} xˉ=108.2 Pa,
问当日生产是否正常?
对这个实际问题可作如下分析:
(1) 这不是一个参数估计问题.
(2)这是在给定总体与样本下, 要求对命题 "合金平均强度不低于
110   P a 110 \mathrm{~Pa} 110 Pa "作出回答: “是” 还是 “否” ?
这类问题称为统计假设检验问题,简称假设检验问题.
(3) 命题: "合金平均强度不低于 110   P a 110 \mathrm{~Pa} 110 Pa " 仅涉及参数 θ \theta θ
范围, 因此该命题是否正确将涉及如下两个参数集合:
Θ 0 = { θ : θ ⩾ 110 } , Θ 1 = { θ : θ < 110 } . \Theta_{0}=\{\theta: \theta \geqslant 110\}, \quad \Theta_{1}=\{\theta: \theta<110\} . Θ0={ θ:θ110},Θ1={ θ:θ<110}.
命题成立对应于 " θ ∈ Θ 0 \theta \in \Theta_{0} θΘ0 ", 命题不成立则对应 "
θ ∈ Θ 1 \theta \in \Theta_{1} θΘ1 ".
在统计学中这两个非空不相交参数集合都称作统计假设, 简称假设.
(4) 我们的任务是利用所给总体 N ( θ , 16 ) N(\theta, 16) N(θ,16) 和样本均值
x ˉ = 108.2   P a \bar{x}=108.2 \mathrm{~Pa} xˉ=108.2 Pa 判断假设 (命题) " θ ∈ Θ 0 \theta \in \Theta_{0} θΘ0
“是否成立.通过样本对一个假设作出"对"或"不对"的具体判断规则就称为该假设的一个检验或检验法则.
检验的结果若是否定该命题, 则称拒绝这个假设, 否则就称接受该假设.
(5)若假设可用一个参数的集合表示, 该假设检验问题称为参数假设检验问题,
否则称为非参数假设检验问题. 例 7.1.2 就是一个参数假设检验问题, 而对假设
“总体为正态分布” 作出检验的问题就是一个非参数假设检验问题.
7.1.2 假设检验的基本步骤
接下来我们来叙述假设检验的基本步骤.
一、建立假设
这里主要叙述参数假设检验问题. 设有来自某一个参数分布族
{ F ( x , θ ) ∣ θ ∈ Θ } \{F(x, \theta) \mid \theta \in \Theta\} { F(x,θ)θΘ}的样本
x 1 , x 2 , ⋯   , x n x_{1}, x_{2}, \cdots, x_{n} x1,x2,,xn, 其中 Θ \Theta Θ 为参数空间, 设
Θ 0 ⊂ Θ \Theta_{0} \subset \Theta Θ0Θ, 且 Θ 0 ≠ ∅ \Theta_{0} \neq \varnothing Θ0=, 则命题
H 0 : θ ∈ Θ 0 H_{0}: \theta \in \Theta_{0} H0:θΘ0 称为一个假设或原假设或零假设 (null
hypothesis), 若有另一个
Θ 1 ( Θ 1 ⊂ Θ , Θ 1 Θ 0 = ∅ \Theta_{1}\left(\Theta_{1} \subset \Theta, \Theta_{1} \Theta_{0}=\varnothing\right. Θ1(Θ1Θ,Θ1Θ0=,常见的一种情况是
Θ 1 = Θ − Θ 0 ) \left.\Theta_{1}=\Theta-\Theta_{0}\right) Θ1=ΘΘ0), 则命题
H 1 : θ ∈ Θ 1 H_{1}: \theta \in \Theta_{1} H1:θΘ1 称为 H 0 H_{0} H0 的对立假设或备择假设
(alternative hypothesis). 于是, 我们感兴趣的一对假设就是
H 0 : θ ∈ Θ 0  vs  H 1 : θ ∈ Θ 1 H_{0}: \theta \in \Theta_{0} \quad \text { vs } H_{1}: \theta \in \Theta_{1} H0:θΘ0 vs H1:θΘ1
其中"vs” 是 versus 的缩写, 是 “对” 的意思, 即表示 H 0 H_{0} H0 H 1 H_{1} H1
的假设检验问题.
对于假设 (7.1.1), 如果 Θ 0 \Theta_{0} Θ0 只含一个点, 则我们称之为简单 (
simple) 原假设, 否则就称为复杂 ( composite) 或复合原假设. 同样,
对于备择假设也有简单与复杂之别. 当 H 0 H_{0} H0为简单假设时,其形式可写成
H 0 : θ = θ 0 H_{0}: \theta=\theta_{0} H0:θ=θ0. 此时的备择假设通常有如下三种可能:
H 1 ′ : θ ≠ θ 0 , H 1 ′ ′ : θ < θ 0 , H 1 ′ ′ ′ : θ > θ 0 . H_{1}^{\prime}: \theta \neq \theta_{0}, \quad H_{1}^{\prime \prime}: \theta<\theta_{0}, \quad H_{1}^{\prime \prime \prime}: \theta>\theta_{0} . H1:θ=θ0,H1′′:θ<θ0,H1′′′:

  • 9
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值