【拒绝采样】公式解析

最新推荐文章于 2024-02-24 02:44:35 发布

冰霜青羽

最新推荐文章于 2024-02-24 02:44:35 发布

阅读量182

点赞数

文章标签：概率论机器学习人工智能

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/qq_35939846/article/details/132827400

版权

在拒绝采样中，我们用以下公式表示给定 $Y$ 的条件下的接受率：

$\frac{f(Y)}{cg(Y)}|Y ) = \frac{f(Y)}{cg(Y)}$

接受率的作用

那么，这个接受率有什么用呢？简单来说，如果 $P (a cce pt ∣ Y)$ 的值较高，这意味着更多的样本会被接受，而拒绝采样的效率也会相应提高。相反，如果这个概率很低，那么很多样本会被拒绝，这会降低采样的效率。

总结有以下四点作用：

保证正确的分布：当我们从建议分布 $g (Y)$ 中取样时，我们并不直接取得来自 $f (Y)$ 的样本。通过拒绝策略，我们可以纠正这个偏差。 $P (a cce pt ∣ Y)$ 允许我们对每个样本进行校准，确保最终的样本集遵循 $f (Y)$ 。
效率评估：理想情况下，我们希望拒绝的样本尽可能少，这样采样过程就会更高效。如果 $P (a cce pt ∣ Y)$ 很低，这意味着我们经常拒绝样本，可能需要考虑选择更好的提议分布 $g (Y)$ 。
理解权重：考虑到 $\frac{f(Y)}{cg(Y)}$ ，我们实际上是在比较目标分布和提议分布在特定值 $Y$ 处的权重。这有助于我们理解两者之间的关系，以及我们需要多大的调整才能从 $g (Y)$ 获得 $f (Y)$ 的样本。
优化常数 $c$ ：为了使拒绝采样方法有效，我们选择 $c$ 使得 $\times g(Y)$ 总是大于或等于 $f (Y)$ 。理想情况下，我们希望 $c$ 越小越好，以减少拒绝的可能性。知道 $P (a cce pt ∣ Y)$ 可以帮助我们调整 $c$ 的值。

公式解析

采用拒绝采样（Rejection Sampling）时，我们的目的是从一个复杂的分布 $f (Y)$ 中抽样，但直接从 $f (Y)$ 中抽样可能是困难的或计算量太大。为了解决这个问题，我们使用一个简单的提议分布 $g (Y)$ 来辅助采样，其中 $g (Y)$ 是我们容易抽样的分布。

然而，我们不能直接从 $g (Y)$ 中取样然后假设它是从 $f (Y)$ 中取得的。为了确保最后的样本遵循 $f (Y)$ 的分布，我们使用了拒绝策略。具体步骤如下：

选择一个常数 $c$ ，使得 $\times g(Y)$ 在所有 $Y$ 上都大于等于 $f (Y)$ 。
从 $g (Y)$ 中抽取一个样本 $y$ 。
从均匀分布 $U (0, 1)$ 中生成一个随机数 $U$ 。
如果 $\frac{f(y)}{c \times g(y)}$ ，则接受样本 $y$ ；否则，拒绝 $y$ 并回到步骤2。

现在，来解释给定的公式：
$\frac{f(Y)}{cg(Y)}|Y ) = \frac{f(Y)}{cg(Y)}$

这个公式描述了给定一个样本 $Y$ 的情况下，它被接受的概率。

1. $P (a cce pt ∣ Y)$ ：这是给定样本 $Y$ 的情况下，它被接受的概率。

2. $\frac{f(Y)}{cg(Y)}|Y )$ ：这表示，给定样本 $Y$ 的情况下，随机数 $U$ 小于 $\frac{f(Y)}{cg(Y)}$ 的概率。

3. $\frac{f(Y)}{cg(Y)}$ ：这是接受 $Y$ 的实际概率。直观地说，这比较了我们真正感兴趣的目标分布 $f (Y)$ 和调整后的提议分布 $\times g(Y)$ 之间的关系。如果 $f (Y)$ 在某个点 $Y$ 的值很高，而 $g (Y)$ 的值相对较低，那么这个比率就会接近1，这意味着在这个点上几乎总是接受样本。