MCMC方法的许多应用是关于贝叶斯统计分析问题的,这些贝叶斯统计分析中常常需要计算后验分布的一些数字特征,如后验期望、后验方差、后验众数、后验分位数等。
蒙特卡洛抽样方法 \textbf{蒙特卡洛抽样方法} 蒙特卡洛抽样方法
设 p ( x ∣ θ ) p(\boldsymbol{x}|\theta) p(x∣θ)表示样本的概率函数(或称为参数 θ \theta θ 的似然函数), π ( θ ) \pi(\theta) π(θ)为 θ \theta θ 的先验分布,则 θ \theta θ 的后验分布为
π ( θ ∣ x ) = p ( x ∣ θ ) π ( θ ) ∫ p ( x ∣ θ ) π ( θ ) d θ ( 1 ) \pi(\theta|\boldsymbol{x}) =\frac{p(\boldsymbol{x}|\theta)\pi(\theta)}{\int p(\boldsymbol{x}|\theta)\pi(\theta) d\theta } \qquad(1) π(θ∣x)=∫p(x∣θ)π(θ)dθp(x∣θ)π(θ)(1)我们的目标是函数 h ( θ ) h(\theta) h(θ)的后验期望
E [ h ( θ ) ∣ x ] = ∫ h ( θ ) π ( θ ∣ x ) = ∫ h ( θ ) p ( x ∣ θ ) π ( θ ) d θ ∫ p ( x ∣ θ ) π ( θ ) d θ ( 2 ) E[h(\theta)|\boldsymbol{x}]=\int h(\theta)\pi(\theta|\boldsymbol{x})=\frac{\int h(\theta)p(\boldsymbol{x}|\theta)\pi(\theta)d\theta}{\int p(\boldsymbol{x}|\theta)\pi(\theta) d\theta} \qquad(2) E[h(θ)∣x]=∫h(θ)π(θ∣x)=∫p(x∣θ)π(θ)dθ∫h(θ)p(x∣θ)π(θ)dθ(2)
当 h ( θ ) = θ h(\theta)=\theta h(θ)=θ时,上式表示 θ \theta θ的后验期望;
当 h ( θ ) = [ θ − E ( θ ∣ x ) ] 2 h(\theta)=[\theta-E(\theta|\boldsymbol{x})]^2 h(θ)=[θ−E(θ∣x)]2,上式表示 θ \theta θ的后验方差。
对于一些复杂问题式(2)没有显式表达,除了使用分析逼近方法或者数值积分方法之外,蒙特卡洛抽样方法是一个可选用的有效计算方法。
因此对于式(2)应用蒙特卡洛抽样方法,从后验分布 π ( θ ∣ x ) \pi(\theta|\boldsymbol{x}) π(θ∣x)中产生i.i.d.观测值 θ 1 , θ 2 , … , θ m \theta_1,\theta_2,\dots,\theta_m θ1,θ2,…,θm,则由大数定律:
h ˉ m = 1 m ∑ i = 1 m h ( θ i ) ( 3 ) \bar{h}_m=\frac{1}{m}\sum_{i=1}^m h(\theta_i) \qquad(3) hˉm=m1i=1∑mh(θi)(3)
这种用式(3)去逼近式(2)的方法被称为蒙特卡洛抽样方法。
很多时候从后验分布 π ( θ ∣ x ) \pi(\theta|\boldsymbol{x}) π(θ∣x)中产生i.i.d.观测值很困难, 而从与后验分布非常接近的分布 g g g中抽样比较容易,从而在蒙特卡洛方法中引入重要性函数的概念。
对于式(2)最右边项的分子:
∫ h ( θ ) p ( x ∣ θ ) π ( θ ) d θ = ∫ { h ( θ ) p ( x ∣ θ ) π ( θ ) g ( θ ) } ⋅ g ( θ ) d θ = E g { h ( θ ) p ( x ∣ θ ) π ( θ ) g ( θ ) } ( 4 ) \int h(\theta)p(\boldsymbol{x}|\theta)\pi(\theta)d\theta =\int \left\{\frac{h(\theta)p(\boldsymbol{x}|\theta)\pi(\theta)}{g(\theta)} \right\}\cdot g(\theta) d\theta=E_g\left\{\frac{h(\theta)p(\boldsymbol{x}|\theta)\pi(\theta)}{g(\theta)} \right\} \\\qquad(4) ∫h(θ)p(x∣θ)π(θ)dθ=∫{
g(θ)h(θ)p(x∣θ)π(θ)}⋅g(θ)dθ=Eg{
g(θ)h(θ)p(x∣θ)π(θ)}(4)
同样对于分母:
∫ p ( x ∣ θ ) π ( θ ) d θ = ∫ { p ( x ∣ θ ) π ( θ ) g ( θ ) } ⋅ g ( θ ) d θ = E g { p ( x ∣ θ ) π ( θ ) g ( θ ) } ( 5 ) \int p(\boldsymbol{x}|\theta)\pi(\theta) d\theta= \int \left\{\frac{p(\boldsymbol{x}|\theta)\pi(\theta)}{g(\theta)} \right\}\cdot g(\theta) d\theta=E_g\left\{\frac{p(\boldsymbol{x}|\theta)\pi(\theta)}{g(\theta)} \right\} \q