PRML读书笔记——采样方法

最新推荐文章于 2024-01-02 18:43:24 发布

GZGlenn

最新推荐文章于 2024-01-02 18:43:24 发布

阅读量3.4k

点赞数

分类专栏：机器学习文章标签： PRML 采样方法采样估计马尔科夫链蒙特卡罗

本文链接：https://blog.csdn.net/hubin232/article/details/70185034

版权

本文介绍了PRML中的采样方法，包括基本的采样技术如重要采样、拒绝采样，以及马尔科夫链蒙特卡罗方法（MCMC）如Metropolis-Hastings算法。重点讨论了各种采样方法在高维空间的适用性和效率，如重要性采样的权重问题和MCMC中的细节平衡条件。同时提到了吉布斯采样和切片采样等高效策略，以及混合蒙特卡罗采样用于解决步长敏感问题。

摘要由CSDN通过智能技术生成

本章中，我们希望解决的基本的问题涉及到关于⼀个概率分布p(z)寻找某个函数 $f(z)$ 的期望。这⾥， $z$ 的元素可能是离散变量、连续变量或者⼆者的组合。因此，在连续变量的情形下，我们希望计算下⾯的期望

E [f] = \int f (z) p (z) d z

$E[f]=\int f(z)p(z)dz$

我们假设，使⽤解析的⽅法精确地求出这种期望是⼗分复杂的。因此，我们采用采样的方法抽取出样本，计算出对应的值

本章的采样方法主要包括：重要采样、拒绝采样、蒙特卡罗采样、吉布斯采样、切片采样和混合蒙特卡罗采样等

基本采样方法

这里，我们研究从一个给定的概率分布中生成随机样本的方法

标准概率分布

这考虑如何从简单的非均匀分布中生成随机数。可以从均匀分布开始，利用变换的方法，形成所需要计算的概率分布，并求出这个概率分布的不定积分的反函数。

假设 $z$ 在区间 $(0,1)$ 上均匀分布，我们使用某个函数 $f(.)$ 对 $z$ 进行变换，得到 $y=f(z)$ ，则y上的概率分布为:

p (y) = p (z) ∣ ∣ ∣ d z d y ∣ ∣ ∣

$p(y)=p(z)\left | \frac{dz}{dy} \right |$

这里，y所具有的分布是我们希望的得到的分布形式。对上式积分，有：

z = h (y) \equiv \int y - \infty p (y ˆ) d y ˆ

$z=h(y)\equiv \int_{-\infty}^{y}p(\widehat{y})d\widehat{y}$

它就是 $p(y)$ 的不定积分，因此 $y=h^{-1}(z)$ 。

这里存在两个难点：（1）变换 $f$ 不容易构造（2）不定积分不一定容易求解

为了对非均匀分布采样，考虑另外的方法：拒绝采样和重要采样，但它们只能处理单变量概率分布的情况。

拒绝采样

拒绝采样的思想是，目前需要采样的概率分布形式复杂，我们引入相对简单的概率分布（提议分布，proposal distribution），这个概率分布能覆盖目标分布，然后直接在提议分布上采样，通过一定的准则选择拒绝还是接受当前的采样值。

假设我们希望从概率分布 $p(z)$ 中采样，但是它不是简单的标准概率分布形式，从中采样困难。与大多数情况类似，假设对于任意给定的
z，我们能够很容易计算 $p(z)$ ，即：

p (z) = 1 Z p p ˜ (z)

$p(z)=\frac{1}{Z_{p}}\widetilde{p}(z)$

现在，我们引入简单的提议分布 $q(z)$ 和常数k，使得：

\forall z, k q (z) \geq p ˜ (x)

$\forall z, \quad kq(z)\geq \widetilde{p}(x)$

则函数 $kq(z)$ 被称为比较函数。整体情况下图说明。拒绝采样器的每个步骤涉及到⽣成两个随机数。⾸先，我们从概率分布 $q(z)$ 中⽣成⼀个数 $z_{0}$ 。接下来，我们在区间 $[0, kq(z_{0})]$ 上的均匀分布
中⽣成⼀个数 $u_{0}$ 。这对随机数在函数 $kq(z)$ 的曲线下⽅是均匀分布。最后，如果 $u_{0} > widetilde{p}(z_{0})$ ，那
么样本被拒绝，否则 $u_{0}$ 被保留。因此，如果它位于图11.4的灰⾊阴影部分，它就会被拒绝。这样，剩余的点对在曲线 $widetilde{p}(z)$ 下⽅是均匀分布的，因此对应的z值服从概率分布 $p(z)$ 。

这里写图片描述

一个样本的接受率为 $\frac{\widetilde{p}(z)}{kq(z)}$ ，因此整体样本的接受率为：

p (a c c e p t e d) = \int {p ˜ ( z ) k q ( z )} q (z) d z = 1 k \int p ˜ (z) d z

$p(accepted)=\int \left \{ \frac{\widetilde{p}(z)}{kq(z)}\right \}q(z) dz=\frac{1}{k}\int \widetilde{p}(z)dz$

显然，k越大，整体接受率越低，因此k越低越好，但是k有需要满足限制 $kq(z)$ 处处不小于 $\widetilde{p}(z)$

一般而言， $q(z)$ 的形式不啊后确定，可以直接基于概率分布 $p(z)$ 构建提议分布的函数形式。首先，可以从 $ln\ p(z)$ 的某些格点处开始计算，计算对应的切线，将各个切线连起来形成界限函数。然后从界限分布中采样，如果样本被接受，则他是所求概率分布的样本；反之，将它并入格点的机会中，计算新的切线，优化界限函数。随着格点数量的增加，界限函数对目标概率分布的近似效果逐渐变好。

这里写图片描述

缺点：因为目标概率分布的情况复杂，找到⼀个较好的提议分布和⽐较函数是⼀件相当困难的事情。此外，接受率随着维度的指数下降是拒绝采样的⼀个⼀般特征。虽然拒绝采样在⼀维或⼆维空间中是⼀个有⽤的⽅法，但是它不适⽤于⾼维空间

重要采样

这种采样方法主要用于估计概率分布的期望。与拒绝采样不同，重要采样不拒绝任何的采样结果，而是给提议分布上的采样结果赋予权重

这里写图片描述

同样假设直接从 $p(z)$ 采样无法完成，但是给定z， $p(z)$ 很容易计算。为了计算期望，我们均匀地对z空间采样，然后计算期望：

E [f] = ≃ \sum l = 1 L p (z (l)) f (z (l))

$E[f]=\simeq \sum_{l=1}^{L}p(z^{(l)})f(z^{(l)})$

显然，这种采样是非常低小的，因为一般而言，目标概率分布都将它的大部分质量限制在z空间的一个很小的区域，也就是说只有很小部分的样本会对求合适产生贡献。

这里再次引入提议分布 $q(z)$ ，期望可以表示为：

E (f) =

最低0.47元/天解锁文章

GZGlenn

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
PRML读书笔记——采样方法

我们假设，使⽤解析的⽅法精确地求出对应期望是⼗分复杂的。因此，我们采用采样的方法抽取出样本，计算出对应的值本章的采样方法主要包括：重要采样、拒绝采样、蒙特卡罗采样、吉布斯采样、切片采样和混合蒙特卡罗采样等
复制链接

扫一扫

专栏目录