关于p-value

p-value的六大原则

1. p值可以指示数据与给定模型的不相容程度

我们基于一系列的假设建立的模型为原假设,同时我们还会建设零假设,即指某种我们想要检测的效应不存在,例如两组无差,或者某个因子与结果无关。p值越小,说明数据与零假设之间越不相容,可将p值看作对零假设的存疑程度/假阳性的出现概率。

2. p值不能衡量某假设为真的概率,也不能衡量数据仅由随机因素造成的概率

尽管研究者常常希望计算出零假设是否为真,但p值只解释数据与假设之间的关系,不解释假设本身。

3. 科学结论,商业决策,政策制定,不应只取决于p值是否达到了一个给定标准
4. 研究者需对研究进行完整的报告,保证透明度,才能做出合理的推论
5. p值或统计显著性不能衡量效应的大小和结果的重要性

某项结果的统计显著性并不代表其在科学,人文,经济上的重要性。p值小不代表效应更重要,p值大也不代表无效应或效应不重要。无论某个效应的影响有多小,当样本量足够大或测量精度足够高时,总能得到小的p值。对于相同效应,测量精度不同时,得到的p值也会不同。

6. p值本身并不能衡量 模型 / 假设 的可信度

在没有一定的背景时,p值能提供的信息很有限。当有其他方法适用时,研究者对数据的分析不应止于p值。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
假设有一个硬币投掷的实验,我们想要检验这个硬币是否是公平的,即正面和反面的概率是否相等。我们进行了100次投掷,其中正面朝上的次数为55次,反面朝上的次数为45次。我们可以使用p-value来判断这个硬币是否是公平的。 在这个例子中,原假设是这个硬币是公平的,备择假设是这个硬币不是公平的。我们可以使用二项分布来计算在原假设成立的情况下,观察到正面朝上55次或更极端结果的概率。具体计算方法如下: 在投掷100次硬币的情况下,正面朝上的次数服从二项分布B(100, 0.5)。在原假设成立的情况下,观察到正面朝上的次数等于或超过55次的概率可以计算为: P(X >= 55) = 1 - P(X < 55) 其中,X表示正面朝上的次数,P(X < 55)是正面朝上的次数小于55次的概率。由于二项分布是离散分布,可以使用累积分布函数来计算概率,即: P(X < 55) = F(54) 其中,F(x)是二项分布的累积分布函数。在Python中,可以使用scipy.stats库中的binom.cdf函数来计算二项分布的累积分布函数。具体计算方法如下: ``` from scipy.stats import binom p_value = 1 - binom.cdf(54, 100, 0.5) print("p-value:", p_value) ``` 运行结果为: ``` p-value: 0.5397946186933708 ``` 因此,观察到正面朝上55次或更极端结果的概率为0.54,大于通常选择的显著性水平0.05。这意味着我们不能拒绝原假设,即不能确定这个硬币是否是公平的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值