式的原假设为_数理统计(4)-假设检验的方法

本次习题课主要介绍检验的方法,跟上一次的习题课的关联非常密切,在这次的总结中会详细的对比两节课所学内容的相同和差异。下面是这次习题课的主要内容:

  • Fisher显著性检验的几个基本概念
  • 单样本正态总体参数的显著性检验
  • 双样本正态总体参数的显著性检验
  • 假设检验和区间估计的关系
  • 单参数指数分布族的显著性检验
    • Bernoulli分布的假设检验
  • 似然比检验
  • p-值
  • 例题

Fisher显著性检验的几个基本概念

原假设和对立假设

设有样本
知道样本来自某一个参数分布族
其中
为参数空间,设

命题
称为
原假设或者零假设(null hypothesis)
命题
称为
对立假设或者备选假设(altenative hypothesis)

我们关心的假设检验问题就是

如果

是单点集那么我们称之为
简单(simple)零假设,否则就称为 复杂(composite)或者复合原假设

拒绝域和接受域

我们把样本空间
划分成两个不交的部分

当样本属于
时,接受
,那么
为接受域

当样本属于
时,拒绝
,那么
为拒绝域

两种错误

时,而样本却落入了拒绝域
,于是我们采取了拒绝
的错误决策,这样的错误为
第一类错误(type I error)
时,而样本却落入了接受域
,于是我们采取了接受
的错误决策,这样的错误为
第二类错误(type II error)

40507f23880b5fc6d5d87bae37961b66.png
两种错误的关系

第一类错误的概率

也记作

第二类错误的概率

也记作

我们知道没有办法找到一个检验使两种错误的概率都尽可能的小。(这里我简写了如果有兴趣可以在评论区跟我讨论一下)

势函数
对于一个检验方法
其拒绝域为
我们称
为此检验的势函数

由定义可以看出

  • 时,此检验犯第一类错误的概率为
  • 时,此检验犯第二类错误的概率为

显著性水平

对于检验
和事先给定的
如果其满足
则称
使检验
的水平或者显著性水平,也称
为显著性水平
的检验

求取某假设的显著性检验的步骤如下

  • 根据实际问题,建立假设
  • 选取一个合适的统计量
    ,使当
    成立时,
    的分布已知,且与参数
    无关(称此分布为统计量
    的零分布)
  • 根据
    的特点,确定拒绝域
    的形状
  • 对于给定的显著性水平
    ,确定拒绝域
  • 由样本观测值
    ,计算统计量
    的值
    ,由
    是否属于
    ,作出最后判断

单样本正态总体参数的显著性检验

单样本正态总体均值的检验

为来自
的iid样本,现在我们感兴趣的是其均值
的如下假设:

64f340a7d2cc94880baae1b6cb7b992f.png
单样本正态总体均值的显著性检验

单样本正态总体方差的检验

为来自
的iid样本,现在我们感兴趣的是其方差
的如下假设:

c8f9e2a0778839cca051804fa7e6bae1.png
单样本正态总体方差的显著性检验

双样本正态总体参数的显著性检验

为来自
的iid样本,设
为来自
的iid样本,并且全样本独立

双样本正态总体均值的检验

我们感兴趣的假设为

924b84102b9189e9fd31c60a9f841b34.png
双样本正态总体均值的显著性检验

其中在最后一种情况下有

双样本正态总体方差的检验

我们感兴趣的假设为

fd47db8f65c9c037fa76b1b1e2050fa4.png
双样本正态总体方差的显著性检验

假设检验和区间估计的关系

我们以一个双边检验的例子来说明这两者之间的关系

对于单样本正态总体均值的显著性检验,当

时,关于假设
的检验统计量为

注意到最后一个式子说明

的置信水平为
的置信区间为

对于单样本正态总体方差的显著性检验,当

未知时,关于假设
的检验统计量为

注意到最后一个式子说明

的置信水平为
的置信区间为

置信水平为

的置信区间与双边检验有异曲同工之妙

我们可以这样理解置信区间:当

落在
的置信水平为
的置信区间内时,在显著性水平
下,我们没有理由拒绝原假设,对于单侧置信限我们也可以用单边的检验去理解。

这里再附一个之前的笔记作为对照

isle:数理统计习题课3.31​zhuanlan.zhihu.com
97f6614e3bd7929ef066dd4fe38bebde.png

单参数指数分布族的显著性检验

首先我们来回顾一下指数分布族

aee363b814be20e15a7089c380b6601f.png
指数分布族定义

则由上述定义我们知道单参数指数分布族可以有如下的表示:

单参数指数分布族
重要推论
是来自单参数指数分布族的iid样本,其中
是严格增函数,则对任意给定的常数
分别是
的非降和非增函数

单参数指数分布族的假设检验

我们感兴趣的有三个假设的问题和其第一类错误概率的最大值:

由于

是非增函数,则第一类错误的最大值为
,我们要求其临界值c满足

同理我们要求这里的临界值c满足

对于双边假设我们有

Bernoulli分布的假设检验

是来自
的iid样本,则样本的分布为:

则此时对于p的显著性检验如下表

c264bd2855660c07a6edd6abc8beac60.png

其中

a1e8b9380c3dacc97f07896ab4bf4cf4.png

似然比检验

针对似然比检验我们用来检验更加一般的内容

似然比统计量
是来自
的iid样本,令
,则我们称统计量
为似然比统计量
似然比检验
似然比统计量
作为检验统计量,且取其拒绝域为
时,其中临界值c满足

注:如果似然比统计量

的零分布位置,如果存在一个统计量
关于
是单调的且它的零分布已知,我们可以给出一个基于
的显著性检验

p-值

为了更好的理解p-值的定义,我们要复习以下的内容:

ccd75e02905756d017ceb85e823991ee.png

由上述的内容我们可以得到下面的单边的p值和双边的p值

单边检验的p值
给定样本观测值
为该检验的p值
双边检验的p值
给定样本观测值
为该检验的p值

p值的意义在于下面这个定理

ff870219e9c206401e51c5751045d9e0.png

由这个定理我们可以知道

  • 样本值
    落入水平为
    的拒绝域的充要条件是此样本的p值小于
  • 换句话说p值是可以拒绝原假设的显著性水平
    的最小值
  • 引入p值的最大优点在于,不用事先给定显著性水平
    ,只用计算样本的p值,对于一切大于此p值的
    ,则拒绝原假设的概率不超过

同时我们还可以知道以下两点

  • p值越小,证据越显著,原假设越荒谬,我们越有理由拒绝原假设
  • 一般来说,当p>0.05时,我们更倾向于接受原假设

例题

5a0a7ffd716621be5746e1d77d0ebe83.png
单样本检验
  • 原假设为
  • 拒绝域为
  • 由于
    则其落入拒绝域,我们可以得到结论:出租车运营不符合常规

e301bab109efe7b593cd4e90376c4d62.png
双样本检验

(1)

  • 检验
  • 取检验统计量
  • 拒绝域为
  • 代入数据
  • 代入题目数据知
    则未落入拒绝域,可以接受原假设

(2)

  • 检验
  • 取检验统计量
  • 拒绝域为
  • 代入数据知
    未落入拒绝域,所以不能认为其有显著性差异

9cca2e7af9944f44ea07fd7619dd2dae.png
原题

4ad042cc8c77626647a4ba6c07555beb.png
应用

7e665387a63388d9168c8b7fc751e612.png
进阶

9(1)

  • 的联合密度为
  • 拒绝域由
    确定

9(2)

  • 时递增,在
    时递减
  • 则拒绝域可以化为

9(3)

10 (第九题的直接应用)

  • 我们可以取的检验统计量为
  • 可以得到的拒绝域为
  • 代入数据知
    则其未落入拒绝域,所以认为没有显著差异

26(1)

  • 的联合密度为
  • 则似然比统计量可以求得

26(2)

  • 关于
    先增后减,所以拒绝域可以是

26(3)

  • 由9题可知
  • 则原题转化成
    且独立求
    的分布
    • 的联合密度为
    • 的联合密度为
    • 可以得出
      前面的项为
      的密度,后面的项为
      的密度

7de9f5cbb7f72ac3c3e0dfb18f3ddf3a.png
似然比检验的应用
  • 的联合密度为
  • 下,求
    解得
  • 可以求出似然比统计量为
    则有
  • 所以拒绝域可以表示为
    由于

621bd41050c664fd2141cc69ae0f4918.png
  • 的联合密度函数为
  • 由于
  • 的联合密度函数为
  • 可以得出
    则可以得到
    即得证
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值