采样方法【1】

本文介绍了概率模型的采样方法,包括原始采样法、基本采样中的Box-Muller方法、拒绝采样、自适应拒绝采样、重要性采样及其应用,并探讨了在EM算法中的采样角色。重点讨论了如何在复杂分布下有效采样,如使用自适应拒绝采样和重要性采样来优化计算期望的过程。
摘要由CSDN通过智能技术生成

对于大多数的概率模型,直接推导求取它的参数,如均值,积分等,通常是很棘手的,比如我们要求函数 f(z) 在概率分布 p(z) 下的期望:

E(f)=f(z)p(z)dz

但是如果我们可以从模型的概率分布采样到足够多的数据 z(l),l=1,...,L ,根据大数定理,期望可以用样本的均值来逼近
E(f^)=1/Ll=1Lf(z(l))

而且
var(f^)=1LE[(fE(f)]2

1. 原始采样法(Ancestral Sampling)

有向图模型的概率分布可以表示成条件概率的积:

p(z)=i=1Mp(zi|pai)

zi 是与节点i相关联的变量, pai 指节点i的父节点相关联的变量。
根据这些变量在有向图中的拓扑顺序依次采样;如果有些变量已经有观察到的值,那么在采样过程中需要把采样的值与已知值做比较,相等则保留采样的值,不相等则这一轮采样的值全部丢弃,从头再来。这种方法的性能随着已观测变量的数目增加急剧降低,所以这种方法在实际中很少会采用。

2. 基本采样法(Basic Sampling)

假设 z 服从某种简单的标准分布,如均匀分布,且 z=f(y) ,那么

p(y)=p(z)dzdy

对上式求积分,即
z=h(y)=yinfp(y^)dy^

直接举个简单的例子吧,比如指数函数

p(y)=λexp(λy)

对上面的概率密度函数积分,得到
z=h(y)=1exp(λy)

z 的取值范围是0到1,这样子我们可以从0到1的均匀分布采样得到z的值【很多语言都能产生从0到1的伪随机数】,并通过 y=h1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值