统计学习方法-马尔可夫链蒙特卡罗法-读书笔记
1、前言
蒙特卡罗法(也称为统计模拟方法),是通过从概率模型的随机抽样进行近似数据的计算方法。MCMC则是以马尔可夫链为概率模型的蒙特卡罗法。
MCMC方法的基本思想是:通过蒙特卡罗法构建一个马尔可夫链,使其平稳分布就是要进行抽样的分布,首先基于该马尔可夫链进行随机游走,产生岩本序列,之后使该平稳分布的样本进行近似的数值计算。
2、蒙特卡罗法
2.1随机抽样
蒙特卡罗法要解决的问题是,假设概率分布的定义已知,通过抽样获得概率分布的随机样本,通过得到的样本对概率分布进行分析,蒙特卡罗法的核心是随机抽样。
一般地蒙特卡罗法右直接抽样法,接受-拒绝抽样法,重复性抽样法等。后两种方法适合于概率密度函数复杂,不能直接抽样的方法。
- 接受-拒绝抽样法
假设有随机变量,其概率密度函数为p(x),目标是得到该概率分布的随机样本,而对这个概率分布进行分析。基本思想如下:假设p(x)不可以直接抽样,找一个可以直接抽样的分布,称为建议分布。假设q(x)是建议分布的概率密度函数,并且有cq(x)>=p(x),对q(x)进行抽样,假设得到的结果是x*,再按照$\frac{p(x)}{cq(x)}$的例随即决定是否接受x,接受拒绝法实际就是按照p(X)的涵盖面积占cq(X)的涵盖面积的比例进行抽样。
算法:
输入:抽样的目标概率分布的概率密度函数p(x)
输出:概率分布的随机样本x1,xn
参数:样本n
(1)选择概率密度函数为q(X)的概率分布作为建议分布,使其对任一x满足cq(X)>=p(X)
(2)按照建议分布q(X)随机抽样得到样本x^,再按照均匀分布在(0,1)范围内进行抽样等到U。
(3)如果u<=p(x*)/cq(x*),则将x^*作为抽样结果,否则,回到步骤(2)
(4)直到n个随机样本,结束
接受-拒接法的有点是容易实现,缺点是效率可能不高。
2.2树学期望估计
蒙特卡罗法按照概率分布p(x)独立的选择n个样本,计算函数f(X)的样本均值
f ^ n = 1 n ∑ i = 1 n f ( x i ) \hat{f}_n=\frac{1}{n}\sum_{i=1}^n{f(x_i)} f^n=n1i=1∑nf(xi)
作为数学期望的近似值,根据大数定理可知,当样本容量增大时,样本均以概率1收敛于数学期望
E p ( x ) [ f ( x ) ] = 1 x = n ∑ i = 1 n f ( x i ) E_{p(x)}[f(x)]=\frac{1}{x=n}\sum_{i=1}^n{f(x_i)} E