什么是贝叶斯定理?朴素贝叶斯有多“朴素”?终于有人讲明白了

贝叶斯定理是一种处理不确定性和概率的方法,通过结合先验经验和新证据来更新判断。朴素贝叶斯算法在分类问题中应用广泛,尽管假设特征间条件独立,但在许多场景下仍能有效工作。从医学诊断到邮件分类,贝叶斯思想在实际生活中发挥着重要作用,帮助我们不断修正认知并作出更准确的预测。

导读:如果有一天,我们知道的统计规律和现实生活发生了冲突,又或者前人的经验不符合亲身经历,那么该怎么办?面对经验与现实的矛盾,我们需要一种应对方案。

作者:徐晟

来源:大数据DT(ID:hzdashuju)

ff442896dfaddf80d2b67da707f60390.png

假设你正在玩抛硬币猜正反的游戏。游戏看上去很公平,没有人在干预硬币结果,硬币看上去也像是普通的硬币。对于即将开始的下一局,请问你该如何下注?

理论上讲,硬币在落地后得到正面和反面的概率是一样的,所以你可以随便猜,总会猜对一半。但那毕竟是理论,你无法确保眼前的这枚硬币也是如此。更何况,你无法提前抛足够多次这枚硬币,来验证你的假设。

那该用怎样的下注策略呢?答案是根据历史信息来决定。比方说,已经抛了10次硬币,其中有8次正面朝上。就是说通过10次实践,硬币正面朝上的概率是80%。虽然这个概率和它的理论值(50%)比可能有偏差,但它仍然是下注的重要参考。如果还有第11次抛硬币,你就应该去猜正面朝上。

更极端点,如果硬币扔了一亿次都是正面朝上,那下一次反面朝上的概率是多少?我们能否坚信它是一枚特殊硬币呢?不能。虽然下一次硬币反面朝上的概率无限接近于零,但它不等于零。只要没有对硬币做出更进一步的确认,无论扔多少次,我们都无法排除反面朝上这个选项,只能无限降低对它的可能性的预期。

大部分人都是根据历史经验不断修正自己的认知。毕竟我们不是先知,不能提前知道所有事件发生的概率。这种思考方式具有现实意义,它背后的数学原理是贝叶斯定理。

02e45003ee56b43d330d70ada664a20f.png

01 什么是贝叶斯定理

预测在生活中必不可少,比如决定是否购买更多的股票、预测某个球队是否获胜、确定下个月是否外出旅游等。要做出准确的预测,不仅需要得到某个事件发生概率的理论值,还要结合实际经验做出合理判断。

换句话说,人对某一事件未来会发生的认知,大多取决于该事件或类似事件过去发生的频率。这就是贝叶斯定理的数学模型,它最早由数学家托马斯·贝叶斯提出。

贝叶斯生活在18世纪,他的本职工作是一位英格兰长老会的牧师。1763年,他发表了论文《论有关机遇问题的求解》,提出了一种解决问题的框架思路,即通过不断增加信息和经验,逐步逼近真相或理解未知。这种思想奠定了贝叶斯理论的基础。

贝叶斯定理的过程可以归纳为:“过去经验”加上“新的证据”得到“修正后的判断”。它提供了一种将新观察到的证据和已有的经验结合起来进行推断的客观方法。

假设有随机事件A和B,它们的条件概率关系可以用以下数学公式表达:

6a2952a59db70a2ea7123f447b206a2e.png

  • 其中,事件A是要考察的目标事件,P(A)是事件A的初始概率,称为先验概率,它是根据一些先前的观测或者经验得到的概率。

  • B是新出现的一个事件,它会影响事件A。P(B)表示事件B发生的概率。

  • P(B|A)表示当A发生时B的概率,它是一个条件概率

  • P(A|B)表示当B发生时A的概率(也是条件概率),它是我们要计算的后验概率,指在得到一些观测信息后某事件发生的概率。

贝叶斯公式给出了通过先验概率和条件概率求出后验概率的方法。举个例子,我们假设A事件代表堵车,B事件代表下雨,并且已知以下数据:

某天下雨的概率是40%,即P(下雨)=0.4。

上班堵车的概率是80%,即P(堵车)=0.8。

如果上班堵车,则这天是雨天的概率有30%,即P(下雨|堵车)=0.3。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值