【详解+推导!!】蒙特卡洛方法、接受拒绝采样、重要性采样、MCMC方法

蒙特卡洛方法、接受拒绝采样、重要性采样、MCMC方法

一、蒙特卡洛方法

1. 什么是蒙特卡洛方法

蒙特卡罗方法也称统计模拟方法,以概率为基础的方法,与它对应的是确定性算法,其核心思想是使用采样+平均(随机近似)的方式去估计出无法计算的值。

蒙特卡洛方法的一个重要应用就是求定积分。来看下面的一个例子。

2. 蒙特卡洛积分推导

我们先说明一般情况再举具体的例子。假设要计算的积分如下:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ByPhvf4x-1617114918750)(2021-03-30-15-56-22.png)]

I = ∫ a b g ( x ) d x I=\int_{a}^{b} g(x)dx I=abg(x)dx
其中被积函数 g ( x ) g(x) g(x) [ a , b ] [a,b] [a,b]内可积,我们选择一个概率密度函数为 f X ( x ) f_X(x) fX(x)的方式进行采样,并且保证在 [ a , b ] [a,b] [a,b]内该采样函数的概率和为1,即 ∫ a b f X ( x ) d x = 1 \int_{a}^{b} f_X(x)dx = 1 abfX(x)dx=1,那么原积分可写成:
I = ∫ a b g ( x ) f X ( x ) f X ( x ) d x = ∫ a b g ( x ) f X ( x ) d x ⋅ ∫ a b f X ( x ) d x = ∫ a b g ( x ) f X ( x ) d x \begin{aligned} I&=\int_{a}^{b} \frac{g(x)}{f_X(x)} f_X(x) dx \\ &=\int_{a}^{b} \frac{g(x)}{f_X(x)} dx \cdot \int_{a}^{b} f_X(x) dx \\ &=\int_{a}^{b} \frac{g(x)}{f_X(x)} dx \end{aligned} I=abfX(x)g(x)fX(x)dx=abfX(x)g(x)dxabfX(x)dx=abfX(x)g(x)dx
我们以概率密度函数 f X ( x ) f_X(x) fX(x)的方式进行采样,得到 N N N个样本,则可以将上面的式子写成离散形式:
I ′ = 1 N ∑ i = 1 N g ( x i ) f X ( x i ) I' = \frac{1}{N} \sum_{i=1}^{N} \frac{g(x_i)}{f_X(x_i)} I=N1i=1NfX(xi)g(xi)
则有 I ′ ≈ I I' \approx I II

举例子:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-txraFPB3-1617114918751)(2021-03-30-16-12-31.png)]

上面的例子其实就是取 f X f_X fX为均匀分布:
f X ( x ) = 1 b − a , a ≤ x ≤ b f_X(x) = \frac{1}{b-a},a \leq x \leq b fX(x)=ba1,a

  • 23
    点赞
  • 81
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值