马尔可夫链蒙特卡罗法

马尔可夫链蒙特卡罗法

蒙特卡罗法

思想:假设概率分布的定义已知,然后通过随机抽样获得概率分布的随机样本,通过得到的随机样本对概率分布的特征进行分析。
for example:从随机抽出的样本中计算出样本均值,从而得到总体的期望。
蒙特卡罗方法的核心:随机抽样
主要有直接抽样,接受-拒绝抽样,重要性抽样

随机抽样

接受拒绝抽样
input:抽样的目标概率分布的概率密度函数 p ( x ) p(x) p(x)
output:概率分布的随机样本 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn
parameters:样本数n
建议分布: q ( x ) q(x) q(x),概率分布: p ( x ) p(x) p(x)
u < = p ( x ∗ ) c q ( x ∗ ) u<= \frac{p(x^* )}{cq(x^ * )} u<=cq(x)p(x)

数学期望估计

样本均值: f n ^ \hat{f_n} fn^
f n ^ = 1 n ∑ i = 1 n f ( x i ) \hat{f_n} = \frac{1}{n}\sum_{i=1}^nf(x_i) fn^=n1i=1nf(xi)
根据大数定律可知,当样本容量增大时,样本均值以概率1收敛于数学期望:
KaTeX parse error: Undefined control sequence: \verfy at position 34: …x)}[f(x)]~,~n->\̲v̲e̲r̲f̲y̲
E p ( x ) [ f ( x ) ] = 1 n ∑ i = 1 n f ( x i ) E_{p(x)}[f(x)] = \frac{1}{n}\sum_{i=1}^nf(x_i) Ep(x)[f(x)]=n1i=1nf(xi)

积分计e算

∫ X h ( x ) d x \int_{\mathcal{X}}h(x)dx Xh(x)dx
h ( x ) h(x) h(x)分解成为一个函数 f ( x ) f(x) f(x)和一个密度函数 p ( x ) p(x) p(x)
∫ X h ( x ) d x = ∫ X f ( x ) p ( x ) d x = E p ( x ) [ f ( x ) ] \int_{\mathcal{X}}h(x)dx = \int_{\mathcal{X}}f(x)p(x)dx = E_{p(x)}[f(x)] Xh(x)dx=Xf(x)p(x)dx=Ep(x)[f(x)]

summery

一般的蒙特卡罗法中的抽样分布是独立的,而马尔可夫链蒙特卡罗法中的抽样样本不是独立的,样本序列形成马尔可夫链

马尔可夫链
基本定义

马尔可夫性:
P ( X t ∣ X 0 , X 1 , X 2 , . . . , X t − 1 ) = P (

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值