今天一个同事问我p-value的事情。这个东西,已经好久不弄了。突然之间问起来,才发现这个值还是需要多深入了解一下
很多东西,不一定是要用才去学。既然碰到了,就多找找资料吧。
自己非专业的理解:pvalue是数据正态分布中的两个边角。一般pvalue的界定值是0.05. 如果大于这个值,说明可信度不高,测试误差率很大,数据不可靠。如果是小于等于0.05,说明误差在0.05以内,是可接受了。
网上的信息是
问:统计学意义(P值)
答:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的P值通常被认为是可接受错误的边界水平。