本次习题课主要介绍检验的方法,跟上一次的习题课的关联非常密切,在这次的总结中会详细的对比两节课所学内容的相同和差异。下面是这次习题课的主要内容:
- Fisher显著性检验的几个基本概念
- 单样本正态总体参数的显著性检验
- 双样本正态总体参数的显著性检验
- 假设检验和区间估计的关系
- 单参数指数分布族的显著性检验
- Bernoulli分布的假设检验
- 似然比检验
- p-值
- 例题
Fisher显著性检验的几个基本概念
原假设和对立假设
设有样本知道样本来自某一个参数分布族其中为参数空间,设
命题称为原假设或者零假设(null hypothesis)
命题称为的对立假设或者备选假设(altenative hypothesis)
我们关心的假设检验问题就是
如果
拒绝域和接受域
我们把样本空间划分成两个不交的部分
当样本属于时,接受,那么为接受域
当样本属于时,拒绝,那么为拒绝域
两种错误
当时,而样本却落入了拒绝域,于是我们采取了拒绝的错误决策,这样的错误为第一类错误(type I error)
当时,而样本却落入了接受域,于是我们采取了接受的错误决策,这样的错误为第二类错误(type II error)
第一类错误的概率
第二类错误的概率
我们知道没有办法找到一个检验使两种错误的概率都尽可能的小。(这里我简写了如果有兴趣可以在评论区跟我讨论一下)
势函数
对于一个检验方法其拒绝域为我们称为此检验的势函数
由定义可以看出
- 当
时,此检验犯第一类错误的概率为
- 当
时,此检验犯第二类错误的概率为
显著性水平
对于检验和事先给定的如果其满足则称使检验的水平或者显著性水平,也称为显著性水平的检验
求取某假设的显著性检验的步骤如下
- 根据实际问题,建立假设
- 选取一个合适的统计量
,使当成立时,的分布已知,且与参数无关(称此分布为统计量的零分布)
- 根据
和的特点,确定拒绝域的形状
- 对于给定的显著性水平
,确定拒绝域
- 由样本观测值
,计算统计量的值,由是否属于,作出最后判断
单样本正态总体参数的显著性检验
单样本正态总体均值的检验
设
单样本正态总体方差的检验
设
双样本正态总体参数的显著性检验
设
双样本正态总体均值的检验
我们感兴趣的假设为
其中在最后一种情况下有
双样本正态总体方差的检验
我们感兴趣的假设为
假设检验和区间估计的关系
我们以一个双边检验的例子来说明这两者之间的关系
对于单样本正态总体均值的显著性检验,当
注意到最后一个式子说明
对于单样本正态总体方差的显著性检验,当
注意到最后一个式子说明
置信水平为
我们可以这样理解置信区间:当
这里再附一个之前的笔记作为对照
isle:数理统计习题课3.31zhuanlan.zhihu.com单参数指数分布族的显著性检验
首先我们来回顾一下指数分布族
则由上述定义我们知道单参数指数分布族可以有如下的表示:
单参数指数分布族
重要推论
设是来自单参数指数分布族的iid样本,其中是严格增函数,则对任意给定的常数,分别是的非降和非增函数
单参数指数分布族的假设检验
我们感兴趣的有三个假设的问题和其第一类错误概率的最大值:
由于
同理我们要求这里的临界值c满足
对于双边假设我们有
Bernoulli分布的假设检验
设
则此时对于p的显著性检验如下表
其中
似然比检验
针对似然比检验我们用来检验更加一般的内容
似然比统计量
设是来自的iid样本,令,则我们称统计量为似然比统计量似然比检验
似然比统计量作为检验统计量,且取其拒绝域为时,其中临界值c满足
注:如果似然比统计量
p-值
为了更好的理解p-值的定义,我们要复习以下的内容:
由上述的内容我们可以得到下面的单边的p值和双边的p值
单边检验的p值
给定样本观测值则为该检验的p值
双边检验的p值
给定样本观测值则为该检验的p值
p值的意义在于下面这个定理
由这个定理我们可以知道
- 样本值
落入水平为的拒绝域的充要条件是此样本的p值小于
- 换句话说p值是可以拒绝原假设的显著性水平
的最小值
- 引入p值的最大优点在于,不用事先给定显著性水平
,只用计算样本的p值,对于一切大于此p值的,则拒绝原假设的概率不超过
同时我们还可以知道以下两点
- p值越小,证据越显著,原假设越荒谬,我们越有理由拒绝原假设
- 一般来说,当p>0.05时,我们更倾向于接受原假设
例题
- 原假设为
- 拒绝域为
- 由于
则其落入拒绝域,我们可以得到结论:出租车运营不符合常规
(1)
- 检验
- 取检验统计量
- 拒绝域为
- 代入数据
- 代入题目数据知
则未落入拒绝域,可以接受原假设
(2)
- 检验
- 取检验统计量
- 拒绝域为
- 代入数据知
未落入拒绝域,所以不能认为其有显著性差异
9(1)
-
的联合密度为
-
- 拒绝域由
确定
9(2)
-
-
在时递增,在时递减
- 则拒绝域可以化为
9(3)
10 (第九题的直接应用)
- 我们可以取的检验统计量为
- 可以得到的拒绝域为
- 代入数据知
则其未落入拒绝域,所以认为没有显著差异
26(1)
-
的联合密度为
- 则似然比统计量可以求得
26(2)
-
-
则关于先增后减,所以拒绝域可以是
26(3)
- 由9题可知
- 则原题转化成
且独立求的分布
- 取
-
的联合密度为
-
的联合密度为
- 可以得出
前面的项为的密度,后面的项为的密度
- 则
- 取
-
的联合密度为
- 在
下,求解得
- 可以求出似然比统计量为
令则有
- 所以拒绝域可以表示为
由于则
-
的联合密度函数为
- 由于
- 则
的联合密度函数为
- 由
- 可以得出
令则可以得到即得证