显著性水平 P值 概念解释

关注WX公众号: commindtech77, 获得数据资产相关白皮书下载地址

回复关键字:推荐系统
下载《新闻资讯个性化推荐系统源码及白皮书》

P是“拒绝原假设时犯错误概率”又或者说是如果你拒绝掉原假设实际上是在冤枉好人的概率

不管怎么表达理解上都有点绕,所以你还是看例子吧。比如你做一个假设( null hypothesis):你的女性朋友平均身高2米,输入你统计的样本数据后,计算机给你返回的p值是0.03。这意味着如果你拒绝“女性朋友平均身高2米”这个结论,犯错的概率是0.03,小于0.05(人们一般认为拒绝一句话时犯错概率小于0.05就可以放心大胆地拒绝了),这个时候你就可以拒绝原假设。如果计算机返回p值是0.9,那么你就会想,这说明拒绝原假设犯错概率高达90%,那么我就不应该拒绝原假设,即你应该认为你的女性朋友平均身高就是2米。

至于什么是alpha呢,上面例子中0.05这个标准就是alpha值,这个标准是可以你自己人为改变的

原假设为女性朋友身高平均值2米,取了若干个样本后测量出样本的平均值为1.6,经过计算(计算过程非常简单,如果总体的方差已知就用Z检验,如果总体的方差未知就用样本方差替代然后用t检验,每本统计书上都有不赘述),在我们设定alpha为0.05时,置信区间为1.8到2.2,咱们取的样本均值1.6不在这个范围内,所以拒绝

“拒绝原假设犯错的概率”是在说什么呢,它是在说,我们假设女孩子们身高均值为2米,计算出来的均值为1.6,跟原假设差距很大,这时候我们拒绝原假设“身高为2米”,我们拒绝这个不靠谱假设时可能犯错的概率<=0.05。

“接受原假设正确的概率”是在说什么呢,它是在说,我们假设女孩子们身高均值为2米,计算出来的均值为1.6,跟原假设差距很大,但我们还是坚持认为原假设“身高为2米,我们坚持这个不靠谱假设时可能正确的概率<=0.05。

看到这里应该所有人都能明白了,“拒绝不靠谱原假设时犯错的概率”跟“接受不靠谱原假设时正确的概率”是一致的。讲过例子之后可以发现,在原话中加上“不靠谱”三个字,有助于我们的理解。

样本均值1.6对应的p值为0.03是什么意思?这是指,在假设全体女孩身高为2米的情况下,咱们随机抽取到一些样本得出均值为1.6米或比1.6米更极端的数值的可能性为0.03,在原假设下抽到这样样本的概率太低了,而我们却十分稀罕地居然一下就抽到了这样的样本,那么正常人的第一反应就是,咱们原先假设身高均值为2米这个假设不对。用统计学的话来说就叫做“由于样本均值落在拒绝域中,所以拒绝原假设”。

可见,p值是在精确的算出一个取样的稀罕程度。alpha值是事先给出了一个对样本稀罕程度的判断,这个值是可以主观去改变的,你可以认为取到样本均值的可能性为0.2或更低就很极端从而拒绝,也可以认为取到样本均值的可能性为0.001或更低才拒绝。一般认为样本稀罕到可能取到的概率<=0.05时,咱们就认为原假设不靠谱。

 

评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值