全概率公式与贝叶斯公式

最新推荐文章于 2021-06-08 20:13:55 发布

Salutonly

最新推荐文章于 2021-06-08 20:13:55 发布

阅读量4.7k

点赞数 3

分类专栏：概率统计文章标签：概率论

本文链接：https://blog.csdn.net/Salutonly/article/details/116788686

版权

概率统计专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了概率论中的全概率公式和贝叶斯公式，阐述了它们的理论与实际意义。全概率公式用于将复杂事件的概率拆分为多个互斥事件的概率之和，而贝叶斯公式则用于在已知结果的情况下更新原因事件的概率。通过新冠病毒检测的案例，解释了即使检测结果为阳性，患病概率也只有40%。这两个公式在统计推断和数据分析中起着关键作用。

摘要由CSDN通过智能技术生成

全概率公式

给定有限或无限个事件 $B_1,B_2,\ldots$ ，两两互斥且每次试验至少发生一个，即 $B_iB_j=\emptyset\left(i\neq j\right)$ 且 $B_1+B_2+\ldots=\Omega$ （其中 $\Omega$ 为必然事件）。现考虑任意一个事件 $A$ ，利用 $\Omega$ 为必然事件且上述事件两两互斥则有：
$P\left(A\right)=P\left(AB_1\right)+P\left(AB_2\right)+\ldots$
利用条件概率的定义：
$P\left(AB_i\right)=P\left(B_i\right)P\left(A\middle| B_i\right)$
从而得到了全概率公式：
$P\left(A\right)=P\left(B_1\right)P\left(A\middle| B_1\right)+P\left(B_2\right)P\left(A\middle| B_2\right)+\ldots$

注：为什么全概率公式很重要？

所谓全概率公式就是将“全”部概率 $P (A)$ 划分成很多部分的和。理论和实用意义在于：在较复杂的情况下直接算 $P (A)$ 不容易，但是 $A$ 总是随着某个 $B_i$ 出现，适当去构造这一组 $B_i$ 往往可以简化计算。

另一种角度理解，把 $B_i$ 看做导致事件 $A$ 发生的一种可能途径。对不同的途径， $A$ 发生的概率即条件概率 $P\left(A\middle| B_i\right)$ 各不相同，而采取哪种途径却是随机的。直观理解：在这种机制下， $A$ 的综合概率 $P (A)$ 应该在最小的 $P\left(A\middle| B_i\right)$ 和最大的 $P\left(A\middle| B_i\right)$ 之间，也不一定是所有 $P (A ∣ B)$ 的算术平均，因为各途径被使用的 $P\left(B_i\right)$ 机会各不相同，也就是如上所示，应该是诸 $P\left(A\middle| B_i\right)$ 以 $P\left(B_i\right)$ 为权重的加权平均值。

贝叶斯公式

在全概率公式的条件下，有
$P\left(B_i\middle|A\right)=P\left(AB_i\right)/P\left(A\right)=P\left(B_i\right)P\left(A\middle| B_i\right)/\sum_{j}{P\left(B_j\right)P\left(A\middle| B_j\right)}$
该公式就是概率论中著名的贝叶斯公式。

注：为什么贝叶斯公式很重要？

形式上看，贝叶斯公式实际上就是条件概率定义与全概率公式的简单推论，之所以著名，在于其现实意义的解释上：先看 $P\left(B_1\right),P\left(B_2\right),\ldots$ 它是在没有进一步的信息，也就是不知道A是否发生的情况下，人们对 $B_1,B_2,\ldots$ 发生可能性大小的认识，现在有了新的信息，也就是知道 $A$ 发生，人们对 $B_1,B_2,\ldots$ 发生的可能性大小有了新的估价。

如果我们把事件 $A$ 看成“结果”，把事件 $B_1,B_2,...$ 看成导致这个结果的可能的“原因”，则利用形象地把全概率公式看做“由原因推结果”；而贝叶斯公式则恰好相反，其作用在于“有结果推原因”：现在有一个“结果” $A$ 已发生了，在众多可能的“原因”中，到底是哪一个导致了这个结果？

举例：新冠病毒在人口中的带病毒率为0.03，但是由于各种原因，携带病毒的不一定呈现阳性，不携带病毒的也可能呈现阳性，假定P(阳性|带病毒)=0.99，P(阴性|带病毒)=0.1，P(阳性|不带病毒)=0.05，P(阴性|不带病毒)=0.95，那么如果一个人检测出阳性，他患新冠的概率是多少？
分析：令携带新冠病毒为事件B_1，那么不携带就是事件B_2，此人阳性则是事件A，从而有
$P\left(B_1\right)=0.03，P\left(B_2\right)=0.97，P\left(A\middle| B_1\right)=0.99，P\left(A\middle| B_2\right)=0.05$
我们的目的是求出 $P\left(B_1\middle| A\right)$ 的大小。
$P\left(B_1\middle| A\right)=P\left(A\middle| B_1\right)P\left(B_1\right)/\left[P\left(A{|B}_1\right)P\left(B_1\right)+P\left(A{|B}_2\right)P\left(B_2\right)\right]$
算出来的结果是40%，也就是说即使检测出阳性，也不一定患病，这在某种程度上与直觉矛盾。