蒙特卡洛-马尔科夫链(MCMC)初步

最新推荐文章于 2022-03-01 15:15:43 发布

hdpai2018

最新推荐文章于 2022-03-01 15:15:43 发布

阅读量429

点赞数

分类专栏：科研学术

本文链接：https://blog.csdn.net/hdpai2018/article/details/103617493

版权

科研同时被 2 个专栏收录

127 篇文章 12 订阅

订阅专栏

学术

55 篇文章 0 订阅

订阅专栏

。

解决什么问题？
我们常常遇到这样的问题：模型构建好之后，有一个概率p(x)p(x)（称为目标分布），不能显式的给出其表达，只能生成一系列符合这个分布的xx。这种问题称为“采样”。

名字解析
Monte Carlo方法：用多次随机求平均的方法来逼近一个值。实际是采样方法的核心

在这里插入图片描述
设计MCMC方法的一个难处，在于如何设计合理的转移概率函数，使得MC链的稳态分布等于要求的概率分布。
MCMC的另一个问题是混合速度，在这篇博客中有所讨论。

MCMC是一个大类，有许多种具体算法，以下举例几种最为著名的。

Gibbs Sampling
Gibbs Sampling处理这样的问题：对于一个高维随机变量x=[x1,x2,x3]x=[x1,x2,x3]，不能写出其各分量的联合概率p(x)p(x)，但是可以写出各个分量之间的条件概率。

首先任取初始值x0x0。在已知当前采样xtxt时，按照如下方法生成t+1时刻采样。

Metropolis-Hastings(MH)
MH方法的一个优点是，即使不能写出概率密度函数p(x)p(x)，可以用一个和其成正比的函数f(x)f(x)来采样。如前所述，这在贝叶斯方法中非常方便。
首先任取初始值x0x0。在已知当前采样xtxt时，按照如下方法生成t+1时刻采样。

直接使用以下方法生成候选样本
xt+1=1−ϵ2−−−−−√xt+ϵν
xt+1=1−ϵ2xt+ϵν
其中ν∼N(0,Σ)ν∼N(0,Σ)，ϵ∈[−1,+1]ϵ∈[−1,+1]是扰动步长。新样本等于当前样本和先验的加权和。另一种表达方法是
xt+1=cosθ⋅xt+sinθ⋅ν
xt+1=cos⁡θ⋅xt+sin⁡θ⋅ν
不同的ϵϵ对应的新采样的轨迹是半个椭圆圆周。椭圆的两轴分别为xtxt和νν。如果ϵ=0ϵ=0，则新采样和旧采样相同（红色）。ϵ或者θϵ或者θ控制扰动幅度。

在这里插入图片描述