假设检验和P值那些事

本文介绍了假设检验和P值的概念,通过一个抛硬币的例子详细解释了假设检验的步骤,探讨了P值的含义,并在R中展示了相关计算过程,帮助读者理解统计学中的这些关键概念。
摘要由CSDN通过智能技术生成

假设检验和P值那些事

记得大学时候学习概率论与数理统计的时候,学习过假设检验,但我不记得课本上有提到过P值。后来翻阅了一些资料,大概弄明白了它们之间的关系,本文旨在以浅显易懂的语言描述严密的数学知识。

假设检验

在《Head First Statistics》一书中,作者给假设检验的定义是“Hypothesis tests give you a way of using samples to test whether or not statistical claims are likely to be true”。其实定义不重要,重要的是我们需要知道假设检验能做什么:以概率统计的视角判别一个统计假说是否成立。

下面举一个烂大街的例子:我有一枚专门用于玩抛硬币猜正反面的游戏的硬币,我需要判断这枚硬币是否是正常的(抛硬币游戏中出现正反面的概率相等)。所以我做了一个假说:该枚硬币是正常的,即抛硬币游戏中出现正面的概率为0.5。

那我现在需要做实验去验证我说的对不对。我抛了20次,正面朝上11次,背面朝上9次(设正面朝上记为1,反面朝上记为0)。基于这个实验结果,我应该做怎样的判断呢?

根据假设检验的一般步骤:

  1. 建立假设

  2. 寻找检验统计量

  3. 确定显著性水平和拒绝域

  4. 做出判断

第一步中我们的原假设 H 0 H_0 H0(null hypothesis)为该枚硬币是正常的,备择假设 H 1 H_1 H1(alternate hypothesis)为该硬币不正常。

注:当原假设正确,而由于样本的随机性使得样本观测值落在拒绝域(critical region或rejection region)而拒绝原假设产生的错误称为第一类错误;当原假设错误,而样本观测值落在接受域而接受原假设产生的错误称为第二类错误。

第二步中根据中心极限定理可知随机变量 X ˉ \bar{X} Xˉ服从正态分布。这里我们的检验统计量选择 t = X ˉ − μ 0 S / n t=\frac{\bar{X}-\mu_0}{S/\sqrt{n}} t=S/n Xˉμ0(这里的 t t t服从自由度为 n − 1 n-1 n1 t t t分布),所以我们使用 t t t分布来估计投掷的均值(这里 X ˉ \bar{X} Xˉ为样本均值, μ 0 \mu_0 μ0为原假设中的均值(期望), S S S为样本标准差, n n n为样本个数)。

t = X ˉ − μ 0 S / n = 0.55 − 0.5 0.5104178 / 20

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值