随机采样知识点整理(Monte Carlo、接受-拒绝采样、重要性采样、MCMC)

这篇博客介绍了三种随机采样方法:蒙特卡洛法用于处理复杂问题的期望计算;接受-拒绝采样通过设置建议分布和拒绝策略来接近目标分布;重要性采样利用权重校正从不同分布采样得到的结果,以求得目标分布的期望。文章还探讨了这些方法在高维问题和样本效率方面的挑战,并以工厂工资期望为例解释了重要性采样的应用。
摘要由CSDN通过智能技术生成

蒙特卡洛法(Monte Carlo Method)

常用于计算一些非常复杂无法直接求解的函数期望。即按一定的概率分布中获取大量样本,用于计算函数在样本的概率分布上的期望。比如,抛硬币,做N次实验,统计正面朝上的次数,期望为正面朝上的次数/总次数。

其中最关键的步骤是:如何按照指定的概率分布\rho (x)进行样本采样

离散的概率分布用概率质量函数(pmf)表示

连续的概率分布用概率密度函数(pdf)表示

 

接受-拒绝采样(Acceptance-Rejection Sampling)

很多实际问题中,\rho(z)是很难直接采样的,因此,需要借助其他手段来采样。既然\rho(z)太复杂在程序中没法直接采样,那么我设定一个程序可抽样的分布q(z)比如高斯分布,然后按照一定的方法拒绝某些样本,达到接近\rho(z)分布的目的,其中q(z)叫做建议分布(proposal distribution)。

具体操作如下,设定一个方便抽样的函数q(z),以及一个常量k,使得\rho(z)总在kq(z)的下方,如上图所示。

  • 给定目标分布密度
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值