采样方法之拒绝采样

最新推荐文章于 2023-12-31 23:46:04 发布

-倾城之恋-

最新推荐文章于 2023-12-31 23:46:04 发布

阅读量1.8k

点赞数 2

分类专栏：机器学习文章标签：统计学习采样方法

本文链接：https://blog.csdn.net/P081513083/article/details/89702552

版权

机器学习专栏收录该内容

37 篇文章 0 订阅

订阅专栏

背景

在基于求逆分布的采样方法中，不免遇到不能求逆的复杂累计分布函数，此时可以借助于拒绝采样方法采样。

原理

拒绝采样的介绍通常从 $\pi$ 的计算或者圆的面积的计算开始。这里我们求面积为例。
已知：边长为 $1$ 的矩形，在不知道 $\pi$ 的值的情况下，求其内切圆面积。
采样方法求解：记 $n = 0$ ; 在该矩形内均匀采样 $(x, y)$ 数据对，如果 $x^2+y^2\le1$ , 则 $n = n + 1$ . 采样 $M$ 次后，面积 $S$ 计算:
$S = n / M$ .
图1：红色点计数为n个，全部点为M个
对于不能求逆的概率分布的采样，我们采用类似的思路。
假设待采样的分布为 $p (z)$ , 甚至可以可以有更复杂的情况，我们仅仅知道分布 $p (z)$ 的未归一化版本 $\widetilde{p}(z)$ :
$p(z)=\frac{\widetilde{p}(z)}{Z_p}$ , $Z_p$ 为归一化系数，很难计算，未知。（实际上，在统计学习中，经常遇到将一些函数 $f (z)$ 归一化，当成概率对待，但是由于种种原因，不能得到归一化系数。）
在当前情况下，我们采样符合 $\widetilde p(z)$ 的样本集合。
此时需要选择一个容易采样的分布 $q (z)$ ，或者直接采样，或者需要求逆采样方法。 $q (z)$ 通常被称为proposal distribution。最好 $q (z)$ 与 $\widetilde p(z)$ 有相似的形状。然后选择合适 $k$ ，使得 $kq(z)\ge \widetilde{p}(z)$ 对任意的 $z$ 成立。为了提高采样效率， $k q (z)$ 最好刚好覆盖 $\widetilde{p}(z)$ 就好，如下图：
在这里插入图片描述
然后我们可以采样过程：

从 $q (z)$ 中采样 $z_0$ （实际是先在横轴定义域均匀分布中采样 $z'_0$ ，经过逆变换得到符合分布 $q (z)$ 的 $z_0$ );
从均匀分布 $0, kq(z_0)]$ 中采样 $u_0$ ;
如果 $u_0<\widetilde {p}(z)$ 接受样本 $z_0$ , 否则拒绝。
这样经过 $m$ 次采样后（接受 $n$ 个样本），得到的样本集 ${z_i\}_{i=1}^{n}$ 符合分布p(z).

证明 ${z_i\}_{i=1}^{n}$ 符合分布p(z)：
http://blog.quantitations.com/inference/2012/11/24/rejection-sampling-proof

任意一次采样的接受概率计算如下（对所有可能被接受的 $z$ 的概率积分）：
$p(accept)=P(z\in q(z) 且 u_0<\widetilde {p}(z))$
$p(accept)=\int \frac{\widetilde{p}(z)}{kq(z)}q(z)dz=\frac{1}{k}\int\widetilde{p}(z)dz$
$\int kq(z)dz=k$ 为蓝线和x轴之间的面积;
$\int\widetilde{p}(z)dz$ 红线与x轴之间区域面积;

在高维的情况下，接受-拒绝采样会出现两个问题，第一是合适的q(x)q(x)分布比较难以找到，第二是很难确定一个合理的 k 值。这两个问题会导致拒绝率很高，无用计算增加。

[1]https://blog.csdn.net/jteng/article/details/54344766
[2]https://blog.csdn.net/u010159842/article/details/78959515

-倾城之恋-

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
3
评论
采样方法之拒绝采样

背景在基于求逆分布的采样方法中，不免遇到不能求逆的复杂累计分布函数，此时可以借助于拒绝采样方法采样。原理拒绝采样的介绍通常从π\piπ的计算或者圆的面积的计算开始。这里我们求面积为例。已知：边长为111的矩形，在不知道π\piπ的值的情况下，求其内切圆面积。采样方法求解：记n=0n=0n=0; 在该矩形内均匀采样(x,y)(x,y)(x,y)数据对，如果x2+y2≤1x^2+y^2\le...
复制链接

扫一扫