统计学假设检验中 p 值的含义具体是什么?


一、作者:李可乐
链接:https://www.zhihu.com/question/23149768/answer/23745483
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

就从打赌开始说起。

一日闲机无聊,我与楼主会饮于望胡楼。饮罢,两人都不想主动买单,于是我提议以置硬币来决定谁买单。
规则是这样的:有二十个一元硬币,谁的菊花朝上多,谁就算赢。
然后楼主先投,有十一个硬币菊花朝上。
他就得意洋洋的看我。
然后我一扔,有十九个硬币个个菊花朝天。

楼主角色由红转白,由白转黑。
拍案而起,大吼一声,你丫作弊,硬币有问题!
我笑而不语问楼主:凭什么说硬币有问题?

难道二十个硬币中十九个硬币菊花朝上就根本不可能么?显然理论上是可能的,但是楼主依旧会认为我在作弊,实际上,任何人见到这个的场景都会怀疑背后有猫腻。

因为楼主或其他任何人都知道:假如这场打赌是公平的话,那么每一个硬币的两面都有相等的
概率向上,所以每个硬币菊花朝上的概率都是1/2也就是0.5,那么十九个菊花朝上的概率是20/1048576,约等于0.00002。

这种概率太小了,楼主认为在假如我没有在硬币上做手脚以让结果有利于我的话是不可能发生这种情况的。

我立刻反驳说,你这是嫉妒我,那我要扔出二十个菊花朝上你还不是要说我也在作弊?


楼主说,没错,我既然认为你扔出十九个菊花朝上是在作弊,那二十个菊花朝上当然也是因为你对硬币动了手脚!

让我们用统计学的语言概括一下。

H0:我没有对硬币动手脚。
H1:我对硬币动了手脚,以让结果偏向于我。

(这里面的H0称之为检验假设,意思是说你要检验的这个假设,H1称之为备择假设。他们两的关系是不能兼容的。这两者只能且必须拒绝一个。假如拒绝H0的话,那么就不能拒绝H1了。)

于是我们做了一个实验(赌博)。

结果出现了十九个硬币菊花朝上的情况。假如赌博是公平的,那么出现这种情况的概率是20/1048576。而比这种情况更加极端的二十个硬币统统朝上的概率是1/1048576,这种概率更加低。

假如我们认为十九个硬币朝上是个小概率事件的话,那么比它更极端的二十个硬币朝上是一个更加极端的更小概率事件。

这两者的和是21/1048576。

于是楼主认为在这么一次实验(赌博)当中出现这么个小概率事件或者比它更极端的事件是不肯能的。

于是只能拒绝H0,于是不能拒绝H1。

也就是说我对硬币动了手脚,以让结果偏向于我。

以上就是假设检验的基本思想,里面涉及到了楼主的一个问题,什么是p值?

这里的p值等于21/1048576,p值就是假如赌博是公平的,那么出现这种情况和比这种情况更极端的概率值。

翻译成干巴巴的语言就是在H0成立的条件下,出现该实验结果或更极端情况的概率值。

『H0成立的条件下,出现该实验结果的概率值。』p 值定义应该还是在 H0条件下,出现现在结果和比现在结果偏离更远的概率值吧


二、




三、

作者:吉米多维奇
链接:https://www.zhihu.com/question/23149768/answer/31704861
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

其实理解起来很简单,基本原理只有3个:1、一个命题只能证伪,不能证明为真2、在一次观测中,小概率事件不可能发生 3、在一次观测中,如果小概率事件发生了,那就是假设命题为假


证明逻辑就是:我要证明命题为真->证明该命题的否命题为假->在否命题的假设下,观察到小概率事件发生了->否命题被推翻->原命题为真->搞定。

结合这个例子来看:证明A是合格的投手-》证明“A不是合格投手”的命题为假-》观察到一个事件(比如A连续10次投中10环),而这个事件在“A不是合格投手”的假设下,概率为p,小于0.05->小概率事件发生,否命题被推翻。

可以看到p越小-》这个事件越是小概率事件-》否命题越可能被推翻-》原命题越可信

---------------------

这个过程实际上和人脑的做判断的过程很相似


四、



五、




参考资源链接:[SPSS卡方检验详解:从基础到应用](https://wenku.csdn.net/doc/1a6w20pzkp?utm_source=wenku_answer2doc_content) 在统计学中,卡方检验是一种分析分类数据的方法,常用于检验两个分类变量之间是否独立。要理解SPSS中如何执行四格表独立性检验,首先要了解四格表(也称为2×2表)的结构,它包含了两个分类变量的频数分布,通常是2个水平的变量交叉比较。 在SPSS中进行四格表独立性检验的步骤如下: 1. 首先,准备你的数据,确保数据已经被正确地录入和编码。 2. 进入SPSS界面,点击顶部菜单栏的“分析”(Analyze)选项。 3. 在下拉菜单中选择“描述统计”(Descriptive Statistics),然后选择“交叉表”(Crosstabs)。 4. 在交叉表对话框中,将一个变量拖入行(row)区域,另一个变量拖入列(column)区域。 5. 点击“统计”(Statistics)按钮,选择“卡方”(Chi-square)检验。 6. 点击“继续”(Continue)后,再点击“确定”(OK)以执行检验。 SPSS将自动计算并提供输出结果,其中包含了χ2统计量和相应的P。χ2是卡方检验的关键输出,它基于实际观测频数与理论期望频数之间的差异来计算。具体来说,χ2计算的是观测频数与期望频数差的平方和,并除以期望频数,最后求和得到。这个反映了观测数据与理论期望之间的差异程度。 P则是χ2统计量在卡方分布下的累积概率,它告诉我们观察到的数据差异或更极端情况出现的概率有多大。在统计分析中,我们通常设定一个显著性水平(如0.05),若P小于这个水平,我们就拒绝原假设,即认为两个变量之间存在统计学上的显著关联;反之,如果P大于显著性水平,我们不能拒绝原假设,即认为两个变量之间没有显著的关联。 为了帮助你更深入地理解卡方检验的应用,推荐参考《SPSS卡方检验详解:从基础到应用》。这本由流行病学和统计学专家编写的指南,详细解释了卡方检验的理论基础和实际操作,特别是在流行病学研究中的应用。它包括了四格表卡方检验的深入讨论,并且通过实例教会你如何解读χ2和P的统计意义,使你能够更加精准地进行数据分析和研究结论的推断。 参考资源链接:[SPSS卡方检验详解:从基础到应用](https://wenku.csdn.net/doc/1a6w20pzkp?utm_source=wenku_answer2doc_content)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值