公式
重要性采样是用一个新的采样分布来代替原有的采样分布,使得采样更加容易或高效。
E
x
∼
p
[
f
(
x
)
]
=
∫
f
(
x
)
p
(
x
)
d
x
=
∫
f
(
x
)
p
(
x
)
q
(
x
)
q
(
x
)
d
x
=
E
x
∼
q
[
f
(
x
)
p
(
x
)
q
(
x
)
]
\begin{aligned} E_{x \sim p}[f(x)] &= \int f(x)p(x)dx\\\\ &= \int f(x) \frac{p(x)}{q(x)}q(x)dx \\\\ &= E_{x \sim q}[f(x) \frac{p(x)}{q(x)}] \end{aligned}
Ex∼p[f(x)]=∫f(x)p(x)dx=∫f(x)q(x)p(x)q(x)dx=Ex∼q[f(x)q(x)p(x)]
从式子中我们可以看出,我们不直接从
p
(
x
)
p(x)
p(x) 里面采样,而是从
q
(
x
)
q(x)
q(x) 里面采样,但是由于两个分布之间有差异,所以我们乘以一个
p
(
x
)
q
(
x
)
\frac{p(x)}{q(x)}
q(x)p(x) 以消除这两个分布间的差异。
小提示
- 这样转变之后,虽然他们的期望是一样的,但是方差不一样,这里就不推了。
- 理论上 p ( x ) p(x) p(x) 和 q ( x ) q(x) q(x) 可以是任意的,但是如果两个分布差异较大,然后采样的次数过少,那么结果可能会有很大的差异(比如说 p ( x ) p(x) p(x) 出现几率大的样本在 q ( x ) q(x) q(x) 上出现的几率很小,这样如果采样很少的话,可能都没有采样到 p ( x ) p(x) p(x) 出现几率大的样本)。