先验概率和后验概率

后验概率是参数{\displaystyle \theta }\theta给定证据{\displaystyle X}X后的概率:{\displaystyle p(\theta |X)}{\displaystyle p(\theta |X)}

似然函数相对,其为证据{\displaystyle X}X给定了参数后的概率:{\displaystyle p(X|\theta )}{\displaystyle p(X|\theta )}

两者有以下联系:

首先定义先验概率服从以下概率分布函数{\displaystyle p(\theta )}{\displaystyle p(\theta )},则样本{\displaystyle x}x的可能性为{\displaystyle p(x|\theta )}{\displaystyle p(x|\theta )},那么后验概率可以定义为

{\displaystyle p(\theta |x)={\frac {p(x|\theta )p(\theta )}{p(x)}}}{\displaystyle p(\theta |x)={\frac {p(x|\theta )p(\theta )}{p(x)}}} [1]

后验概率可以写成更易记忆的形式,为

后验概率 {\displaystyle \propto }\propto 可能性 {\displaystyle \times }\times 先验概率。

实例[编辑]

假设一个学校里有60%男生和40%女生。女生穿裤子的人数和穿裙子的人数相等,所有男生穿裤子。一个人在远处随机看到了一个穿裤子的学生。那么这个学生是女生的概率是多少?

使用贝叶斯定理,事件A是看到女生,事件B是看到一个穿裤子的学生。我们所要计算的是P(A|B)。

P(A)是忽略其它因素,看到女生的概率,在这里是40%

P(A')是忽略其它因素,看到不是女生(即看到男生)的概率,在这里是60%

P(B|A)是女生穿裤子的概率,在这里是50%

P(B|A')是男生穿裤子的概率,在这里是100%

P(B)是忽略其它因素,学生穿裤子的概率,P(B) = P(B|A)P(A) + P(B|A')P(A'),在这里是0.5×0.4 + 1×0.6 = 0.8.

根据贝叶斯定理,我们计算出后验概率P(A|B)

{\displaystyle P(A|B)={\frac {P(B|A)P(A)}{P(B)}}={\frac {0.5\times 0.4}{0.8}}=0.25}P(A|B)={\frac  {P(B|A)P(A)}{P(B)}}={\frac  {0.5\times 0.4}{0.8}}=0.25

可见,后验概率实际上就是条件概率。

计算[编辑]

根据贝叶斯定理,一个随机变量在给定另一随机变量值之后的后验概率分布可以通过先验概率分布似然函数相乘并除以归一化常数求得

{\displaystyle f_{X\mid Y=y}(x)={f_{X}(x)L_{X\mid Y=y}(x) \over {\int _{-\infty }^{\infty }f_{X}(u)L_{X\mid Y=y}(u)\,du}}}{\displaystyle f_{X\mid Y=y}(x)={f_{X}(x)L_{X\mid Y=y}(x) \over {\int _{-\infty }^{\infty }f_{X}(u)L_{X\mid Y=y}(u)\,du}}}

上式为给出了随机变量{\displaystyle X}X在给定数据{\displaystyle Y=y}Y=y后的后验概率分布函数,式中

  • {\displaystyle f_{X}(x)}f_{X}(x){\displaystyle X}X的先验密度函数,
  • {\displaystyle L_{X\mid Y=y}(x)=f_{Y\mid X=x}(y)}{\displaystyle L_{X\mid Y=y}(x)=f_{Y\mid X=x}(y)}{\displaystyle x}x的似然函数,
  • {\displaystyle \int _{-\infty }^{\infty }f_{X}(u)L_{X\mid Y=y}(u)\,du}{\displaystyle \int _{-\infty }^{\infty }f_{X}(u)L_{X\mid Y=y}(u)\,du}为归一化常数,
  • {\displaystyle f_{X\mid Y=y}(x)}{\displaystyle f_{X\mid Y=y}(x)}为考虑了数据{\displaystyle Y=y}Y=y{\displaystyle X}X的后验密度函数。

置信区间[编辑]

后验概率是考虑了一系列随机观测数据的条件概率。对于一个随机变量来说,量化其不确定性非常重要。其中一个实现方法便是提供其后验概率的置信区间

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值