蒙特卡罗方法

本文介绍了蒙特卡罗方法,包括为何需要采样以及蒙特卡罗方法的基础。讨论了重要采样在优化计算效率中的作用,并详细阐述了马尔可夫链蒙特卡罗(MCMC)方法,特别是Gibbs采样在处理无向模型中的应用。总结指出,蒙特卡罗方法是解决复杂模型计算问题的重要工具。
摘要由CSDN通过智能技术生成

一,采样和蒙特卡罗方法

为什么需要采样

当我们需要以较小的代价近似许多项的和或某个积分时,采样是一种很灵活的选择。

蒙特卡罗采用的基础

蒙特卡罗方法的思想是把这个和或者积分视作某分布下的期望,然后通过估计对应的平均值来近似这个期望

令:

s=xp(x)f(x)=Ep[f(x)] s = ∑ x p ( x ) f ( x ) = E p [ f ( x ) ]

或者
s=p(x)f(x)dx=Ep[f(x)] s = ∫ p ( x ) f ( x ) d x = E p [ f ( x ) ]

那么我们就可以通过从分布 p p 中抽样出n个样本 x ( 1 ) , x ( 2 ) , , x ( n ) 来近似s并得到一个经验平均值:
ŝ n=1ni=1nf(x(i)) s ^ n = 1 n ∑ i = 1 n f ( x ( i ) )

其中基本依据是 大数定理中心极限定理

但有时我们并不能从基准分布 p(x) p ( x ) 中轻易地采样,这就需要一些其他采样的方法,如重要采样等等,但其中最通用的方式是构建一个收敛到目标分布的估计序列,这就是MCMC(马尔可夫链蒙特卡罗方法)。

二,重要采样

在蒙特卡罗方法中确定积分中哪一部分作为概率分布 p

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值