马尔可夫链蒙特卡罗法
蒙特卡罗法
思想:假设概率分布的定义已知,然后通过随机抽样获得概率分布的随机样本,通过得到的随机样本对概率分布的特征进行分析。
for example:从随机抽出的样本中计算出样本均值,从而得到总体的期望。
蒙特卡罗方法的核心:随机抽样
主要有直接抽样,接受-拒绝抽样,重要性抽样
随机抽样
接受拒绝抽样
input:抽样的目标概率分布的概率密度函数 p ( x ) p(x) p(x)
output:概率分布的随机样本 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn
parameters:样本数n
建议分布: q ( x ) q(x) q(x),概率分布: p ( x ) p(x) p(x)
u < = p ( x ∗ ) c q ( x ∗ ) u<= \frac{p(x^* )}{cq(x^ * )} u<=cq(x∗)p(x∗)
数学期望估计
样本均值: f n ^ \hat{f_n} fn^
f n ^ = 1 n ∑ i = 1 n f ( x i ) \hat{f_n} = \frac{1}{n}\sum_{i=1}^nf(x_i) fn^=n1i=1∑nf(xi)
根据大数定律可知,当样本容量增大时,样本均值以概率1收敛于数学期望:
KaTeX parse error: Undefined control sequence: \verfy at position 34: …x)}[f(x)]~,~n->\̲v̲e̲r̲f̲y̲
E p ( x ) [ f ( x ) ] = 1 n ∑ i = 1 n f ( x i ) E_{p(x)}[f(x)] = \frac{1}{n}\sum_{i=1}^nf(x_i) Ep(x)[f(x)]=n1i=1∑nf(xi)
积分计e算
∫ X h ( x ) d x \int_{\mathcal{X}}h(x)dx ∫Xh(x)dx
将 h ( x ) h(x) h(x)分解成为一个函数 f ( x ) f(x) f(x)和一个密度函数 p ( x ) p(x) p(x)
∫ X h ( x ) d x = ∫ X f ( x ) p ( x ) d x = E p ( x ) [ f ( x ) ] \int_{\mathcal{X}}h(x)dx = \int_{\mathcal{X}}f(x)p(x)dx = E_{p(x)}[f(x)] ∫Xh(x)dx=∫Xf(x)p(x)dx=Ep(x)[f(x)]
summery
一般的蒙特卡罗法中的抽样分布是独立的,而马尔可夫链蒙特卡罗法中的抽样样本不是独立的,样本序列形成马尔可夫链
马尔可夫链
基本定义
马尔可夫性:
P ( X t ∣ X 0 , X 1 , X 2 , . . . , X t − 1 ) = P (