知识是一种概率

知识是一种概率

最近在看《那些让你更聪明的科学新概念》时,了解到“基本概率”的概念:

每当一个统计学家想要基于现有证据预测事件发生的概率时,有两个必须考虑的信息点:证据本身的可靠性,我们必须计算它的可靠程度;单纯以相对发生率来计算事件发生的可能性。第二种数据其实就是基本概率。

书中给出一个容易忽略基本概率的例子,我看了答案之后发现自己算错了。

假设你参加了某种罕见癌症的检查。在一般人群中,这种癌症的罹患概率是1%(基本概率),而广泛的实验证明,这项检查的准确率是79%。更精确地说,尽管检查不会漏诊这项癌症,但是有21%的可能会被误诊为这个癌症,也就是所谓的假阳性。如果你接受了检查,检查结果是阳性的,那么,真的患癌的可能性是多大呢?

这个例子可以用贝叶斯公式计算出来,应该是4.6%[^1],我错误之处在于遗漏了“不会漏诊”这个条件,也就是如果患癌,则一定能检测到。大多数人的第一印象是从检查的可信度近80%得出确实患癌的可能性就是80%左右,这是错的。因为他们只关注到了检查的可信度,却忽视了基本概率。

另一方面,证据本身的可靠性也很重要。比如前段时间在学术圈被火热讨论的新闻“美国政治学顶级学术期刊《政治分析》宣布禁用P值”。这里的P值用于描述无效假设成立的可能性,现在学术界的一个被广泛认可的标准,是 P 值要小于 0.05。如果 P > 0.05 ,别人会认为你这个结果很可能纯属巧合,根本不值得认真对待;如果 P < 0.05 ,人们就说这个结果是“ 显著的 ”。

事实上,这个标准没有科学依据,只是约定俗成的,是由英国的统计学家罗纳德·费希尔(Ronald Fisher)在几十年前提出的。他当时选择了0.05这个数值,意思是 P < 0.05 的结果才“值得看”。他其实认为P < 0.001 才是可以接受的结论。 但问题在于,做实验想要得到 P 值小于0.001的结果,需要找太多受试者,成本实在太高。于是大家退而求其次,都默认了 0.05,其实这个标准都是很难达到的。

过去几年,在经济学、心理学等领域的论文中,P值的分布,在0.05处有明显的凸起,唯一的解释,就是有很多论文故意把P值做到了恰好在0.05以内。[^2]
Pzhi

所以,学习知识不仅要知其然,还要知其所以然。在《那些让你更聪明的科学新概念》中,意大利理论物理学家卡尔罗·罗威利(Carlo Rovelli)提到

本质上,知识是一种概率,这是当代实用主义哲学强调的概念。

科学就是在不断质疑中发展,知识可以随时间慢慢演化,将来新的证据和新的论证方法可能会改变现有的知识,所以也可以说很多知识是不确定的。数学物理学家弗里曼·戴森认为科学就是反叛的产物,只有反叛的心态才是科学的正确态度。而尼采也曾经提出,根本不存在什么绝对的、客观的真理。所以我们不能盲目地听从专家的意见,而应该亲自去验证知识的来源是否可靠,最好能像数学一样,一步一步地严格推理。

我们需要保持质疑精神,学会在冲突信息中随时获得新知,以应对快速变化的世界。


[1] 设A事件为患癌,B事件为检查呈阳性。P(A|B)=P(A)/P(B)*P(B|A)=0.01/(1*0.01+0.99*0.21)*1=0.045893
[2] P<0.05:科学家的隐藏动机.万维钢.2018.图中三个研究的出处可以在这里找到:http://datacolada.org/41

聊技术、谈人生 开普勒鑫球
作者|开鑫金服-杜健
编辑|Andy

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值