概率统计Python计算：贝叶斯公式

戌崂石

已于 2024-05-21 21:20:52 修改

阅读量2.5k

点赞数 6

分类专栏：概率统计文章标签：概率论

于 2021-05-02 14:54:46 首次发布

本文链接：https://blog.csdn.net/u012958850/article/details/116353578

版权

概率统计专栏收录该内容

76 篇文章

订阅专栏

在这里插入图片描述
根据完备事件组 $A_1, A_2,\dots , A_n$ 的先验概率序列 $P(A_1), P(A_2), \dots, P(A_n)$ ，对事件 $B$ 的似然度序列 $P(B|A_1)，P(B|A_2)，…，P(B|A_n)$ ，计算第 $i$ 个因素 $A_i$ 的后验概率 $P(A_i|B)$ ，利用贝叶斯公式
$P(A_i|B)=\frac{P(A_i )P(B|A_i)}{\sum_{i=1}^nP(A_i)P(B|A_i)}$
可以先算得中间序列 $P(A_1)P(B|A_1),P(A_2)P(B|A_2),\dots,P(A_n)P(B|A_n)$ ，贝叶斯公式中的分母就是该序列的和（即全概率公式的计算结果），分子是该序列中的第 $i$ 个元素。两者之商就是 $P(A_i|B)$ ，即 $A_i$ 的后验概率。实现这一算法的Python函数定义如下：

def bayes(prioProb, liklihood, i):  #计算第i个因素Ai相对B的后验概率
    temp=prioProb*liklihood         #因素先验概率与对B的似然率按元素相乘
    total=temp.sum()                #B的先验概率
    return temp[i-1]/total          #Ai相对于B的后验概率

第1~4行定义函数bayes。该函数有3个参数，prioProb和likelihood与计算全概率公式的函数totalProb（定义见博文《全概率公式》）的同名参数一样，表示完备事件组 $A_1,A_2,\cdots,A_n$ 中各事件的先验概率序列 $P(A_1),P(A_2),\cdots,P(A_n)$ 和对事件 $B$ 的似然率序列 $P(B|A_1),P(B|A_2),\cdots,P(B|A_n)$ 。参数i表示所要计算的是第 $i$ 个事件 $A_i$ 相对于 $B$ 的后验概率 $P(A_i|B)$ 。第2行按元素将prioProb和likelihood相乘，得到序列 $P(A_1)P(B|A_1),P(A_2)P(B|A_2),\cdots,P(A_n)P(B|A_n)$ ，存于temp。第3行调用temp的求和函数sum按全概率公式计算 $B$ 的先验概率 $P (B)$ ，存于total。由于numpy的array类数组元素下标是从0开始起算的，故 $P(A_i)P(B|A_i)$ 存储为temp[i-1]，第4行将其与total之商，即 $P(A_i|B)=P(A_i)P(B|A_i)/P(B)$ 作为返回值返回。
例1 根据临床记录，某种诊断癌症的试验具有如下的效果：若以 $A$ 表示事件“试验反应为阳性”，以 $C$ 表示事件“被诊断者患有癌症”，则有 $P (A ∣ C) = 19/20$ ， $P(\bar{A}|\overline{C})=19/20$ 。今对自然人群进行普查，设被试验的人患有癌症的概率 $P (C) = 1/200$ ，试求 $P (C ∣ A)$ 。
解：在本例中，一个人试验反应是阳性（事件 $A$ ）无非是因为此人本身患有癌症（事件 $C$ ，此时为确诊），或没有患癌症（ $\overline{C}$ ，此时为误诊）。因此，完备事件组 $C$ 和 $\bar{C}$ 可视为是促成事件 $A$ 发生的因素。根据题设， $P (C) = 1/200$ ，则 $P(\overline{C})=199/200$ 。由 $P(A|C)=P(\overline{A}|\overline{C})=19/20$ ，可得 $P(A|\overline{C})=1-P(A|C)=1/20$ 。
$P(A)=P(C)P(A|C)+P(\overline{C}) P(A|\overline{C})=\frac{1}{200}\cdot \frac{19}{20}+\frac{199}{200}\cdot\frac{1}{20}=\frac{109}{2000}.$
由于所求 $P (C ∣ A)$ 为后验概率，故运用贝叶斯公式计算
$P(C|A)=\frac{P(C)P(A|C)}{P(C)P(A|C)+P(\overline{C})P(A|\overline{C})}=\frac{19}{218}.$
下列代码验算此结果。

import numpy as np                  #导入numpy
from sympy import Rational as R     #导入Rational
prioProb=np.array([R(1,200),R(199,200)])
likelihood=np.array([R(19,20), R(1, 20)])
p=bayes(prioProb,likelihood, 1)
print('P(C|A)=%s'%p)