关于接受拒绝采样,请查看刘建平老师的博客
本文主要探讨接受拒绝采样究竟是为了做什么
我们按照下图讲述我们接受拒绝采样的目标
我们的目标是希望能选择一系列取值的x(比如选择n个x值)。
Q:这里有个问题,这些值是怎么选取的?
例如我们在[1,2]区间上,选了5个值,以下是三种方案
- [1,1,2,3.4]
- [1,2,3,4,5]
- [3,3,3,3,3]
那么哪种选择比较好呢?
评价指标 显然,我们希望其符合x的分布p(x)最好,也就是说,p(x)大的地方,理论上选择出来的次数应该多一些,例如,若p(1)取值大的话,方案一可能就是更趋近于真实的。
但事实上,p(x)的分布情况,我们往往难以获取。那么在不知道p(x)分布的情况下,进行采样可以获得比较好的贴近p(x)分布的采样呢?
这就是接受拒绝采样所做的事情。(阅读以下上边的链接)
这里采用一样的符号标记。
当按照q(x)获得了一个样本
z
0
z_0
z0时,实际上如果我们全都加入我们的方案话,他是满足q(x)的分布的。这个时候。如果我们再引入一个均匀分布的变量,让其在
(0,kq(
z
0
z_0
z0)) 中采样得到一个值u。如果u落在了上图中的灰色区域,则拒绝这次抽样,否则接受这个样本
z
0
z_0
z0。这样我们就能得到一个复合f(x)分布方案。