浅谈先验分布和后验分布

前言

上文提到贝叶斯定理是先验分布和后验分布转换的桥梁,贝叶斯学派计算参数后验分布的难点在于如何选择参数的先验分布,本文通过二项式分布的例子来形象的表达如何选择先验分布和计算后验分布,并阐述了先验分布和后验分布是如何转换的,最后对本文进行总结。

 

                                                                                         共轭先验分布


定义

当先验分布和后验分布相同时,先验分布和后验分布为共轭先验。

条件

为了满足共轭先验这一条件,先验分布和似然函数分布应相同。

目的

先验分布和后验分布按照人的直观来说应是相同的,且可以形成一个先验链,即随着新观测数据的增加,当前参数的后验分布成为前验分布,新观测数据下的参数分布为后验分布。

 

                                                                             先验分布和后验分布的转化过程


连续采样新的观测数据时,当前参数的概率分布为先验分布,计算新采集的数据(可能是一个或一组)的似然函数,计算先验分布和似然函数的乘积,并对该乘积结果进行归一化,得到参数的后验分布,若又有新的观测数据时,则重复以上过程,更新参数的后验分布。

                                                                          先验分布和后验分布关系的应用举例


【例】用一个二值随机变量x表示抛硬币的结果,1表示正面,0表示反面。假设该硬币的正反两面的概率不相同,且正面概率为参数u,若抛掷N次,正面向上的次数为m,反面向上的此时为l。求(1)参数u的后验概率分布,(2)若连续抛掷硬币,求先验分布和后验分布参数的关系,(3)正面向上的概率

解:(1)多次抛硬币符合二项式分布,正面向上次数为m的概率为:

                                                  

为了满足共轭先验的条件,参数u的先验分布也应与似然函数的分布相同。即选择参数u的先验分布为beta分布,如下

                                                      

等式右边的系数部分是为了满足先验分布的标准化,即:

                                                     

参数u的先验分布的期望:

                                                     

 

后验分布等于前验分布和似然函数的乘积,并对该结果进行标准化,得到该参数的后验分布

后验分布形式:

 

标准化后的结果:

 

(2)连续抛掷硬币时,当前的参数分布为先验分布,与新采样数据的似然函数进行乘积,再对该结果进行标准化。容易知道,后验分布的形式保持不变,指数发生变化。

比较数据集似然函数的二项式分布和beta分布,可知a表示正面向上的次数,b表示反面向上的次数,由(1)的后验概率分布可知,当新数据的抛掷结果为m次正面向上,l次反面向上,那么后验概率分布的指数表示m+a次正面向上,l+b次反面向上,以此递推。

若a=1,b=1,参数u的先验分布为:

                                                              

当观测新数据为1次正面向上(m=1),2次反面向上(l=2),则后验分布的指数表示2次正面向上,3次反面向上。

后验分布如下图:

                                                          

(3)根据贝叶斯的求和准则与求积准则,参数u的分布采用后验分布,得:

                                           

参考先验分布的参数u的期望,可得后验分布:

                                                                

                                                                                      总结


后验分布等于先验分布与似然函数乘积的标准化,共轭先验的目的在于使先验分布和后验分布保持同一形式,形成先验链,当有新的观测数据时,当前的分布成为先验分布,重新计算参数的后验分布。

                                                               

参考:

Christopher M.Bishop <<Pattern Reconition and Machine Learning>>

先验分布后验分布是贝叶斯统计推断方法中的重要概念。 先验分布是指在进行推断之前,根据以往的知识、经验和信息对未知参数的分布进行估计。通常情况下,先验分布是由先前的实验数据、专家意见或相关的先验信息所确定。先验分布可以看做是对未知参数的先前假设或猜测。 后验分布则是在得到观测数据之后,根据贝叶斯公式将先验分布与似然函数结合起来,得到参数的后验分布后验分布是在已经观测到数据之后对参数进行概率推断的结果,可以看作是在先验分布的基础上通过数据进行修正的结果。 举个例子来说明先验分布后验分布的概念。假设我们要估计某种产品的成功率,根据以往的经验,我们对其成功率有一个先验分布,比如服从均匀分布。然后我们进行若干次实验,观测到了产品成功的次数。根据贝叶斯公式,我们将先验分布与似然函数结合起来,得到参数的后验分布后验分布可以告诉我们在观测到这些数据之后,产品成功率的可能取值范围以及其概率分布先验分布后验分布的使用,能够帮助我们在统计推断中更准确地估计未知参数的值。在贝叶斯统计推断中,先验分布后验分布起到了关键的作用,使我们能够从先验的角度出发,并通过不断迭代来更新和修正我们的估计。先验分布后验分布是贝叶斯统计推断方法中的重要基础。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值