采样方法【1】

jiqiujia

于 2015-08-25 17:54:13 发布

阅读量1.4k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiqiujia/article/details/47980693

版权

本文介绍了概率模型的采样方法，包括原始采样法、基本采样中的Box-Muller方法、拒绝采样、自适应拒绝采样、重要性采样及其应用，并探讨了在EM算法中的采样角色。重点讨论了如何在复杂分布下有效采样，如使用自适应拒绝采样和重要性采样来优化计算期望的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于大多数的概率模型，直接推导求取它的参数，如均值，积分等，通常是很棘手的，比如我们要求函数 $f(z)$ 在概率分布 $p(z)$ 下的期望：

E (f) = \int f (z) p (z) d z

$E(f) = \int f(z)p(z)dz$
但是如果我们可以从模型的概率分布采样到足够多的数据

z(l),l=1,...,L $z^{(l)},l=1,...,L$ ，根据大数定理，期望可以用样本的均值来逼近

E (f^) = 1 / L \sum l = 1 L f (z (l))

$E(\hat f)=1/L\sum_{l=1}^Lf(z^(l))$
而且

v a r (f^) = 1 L E [(f - E (f)] 2

$var(\hat f) = \frac{1}{L}E[(f-E(f)]^2$

1. 原始采样法(Ancestral Sampling)

有向图模型的概率分布可以表示成条件概率的积：

p (z) = \prod i = 1 M p (z i | p a i)

$p(z) = \prod_{i=1}^Mp(z_i|pa_i)$

zi $z_i$ 是与节点i相关联的变量，

pai $pa_i$ 指节点i的父节点相关联的变量。
根据这些变量在有向图中的拓扑顺序依次采样；如果有些变量已经有观察到的值，那么在采样过程中需要把采样的值与已知值做比较，相等则保留采样的值，不相等则这一轮采样的值全部丢弃，从头再来。这种方法的性能随着已观测变量的数目增加急剧降低，所以这种方法在实际中很少会采用。

2. 基本采样法（Basic Sampling）

假设 $z$ 服从某种简单的标准分布，如均匀分布，且 $z=f(y)$ ，那么

p (y) = p (z) ∣ ∣ ∣ d z d y ∣ ∣ ∣

$p(y) = p(z)\left|\frac{dz}{dy}\right|$
对上式求积分，即

z = h (y) = \int y - inf p (y^) d y^

$z = h(y) = \int_{-\inf}^{y}p(\hat y)d\hat y$

直接举个简单的例子吧，比如指数函数

p (y) = λ e x p (- λ y)

$p(y) =\lambda exp(-\lambda y)$
对上面的概率密度函数积分，得到

z = h (y) = 1 - e x p (- λ y)

$z = h(y) = 1 - exp(-\lambda y)$

z $z$ 的取值范围是0到1，这样子我们可以从0到1的均匀分布采样得到z的值【很多语言都能产生从0到1的伪随机数】，并通过

y=h−1

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。