【机器学习系列】MCMC第四讲：Metropolis Hastings采样算法

最新推荐文章于 2024-05-08 10:02:29 发布

CHEONG_KG

最新推荐文章于 2024-05-08 10:02:29 发布

阅读量1.1k

点赞数 2

分类专栏：机器学习文章标签：机器学习 MCMC 马尔可夫链蒙特卡洛方法 MH算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feilong_csdn/article/details/115661201

版权

机器学习专栏收录该内容

44 篇文章

订阅专栏

作者：CHEONG

公众号：AI机器学习与知识图谱

研究方向：自然语言处理与知识图谱

阅读本文之前，首先注意以下两点：

1. 机器学习系列文章常含有大量公式推导证明，为了更好理解，文章在最开始会给出本文的重要结论，方便最快速度理解本文核心。需要进一步了解推导细节可继续往后看。

2. 文中含有大量公式，若读者需要获取含公式原稿Word文档，可关注公众号【AI机器学习与知识图谱】后回复：MCMC第四讲，可添加微信号【17865190919】进学习交流群，加好友时备注来自CSDN。原创不易，转载请告知并注明出处！

本文介绍MCMC方法其中之一的MH采样方法。

一、MCMC解决的问题

MCMC是一种方法论，MH采样方法和Gibbs采样方法是MCMC的两个具体实现。MCMC的目的求后验概率 $p (z)$ ，有了后验概率 $p (z)$ 后目标是求关于后验概率 $p (z)$ 的期望值：

在这里插入图片描述

从公式可知，对后验概率 $p (z)$ 进行采样可直接求出期望值，但是直接从 $p (z)$ 采样较为困难，MCMC便是为了解决从 $p (z)$ 中采样困难的问题。

二、MH采样算法

MCMC的思想是构造一个马氏链，该马氏链能够趋向于平稳分布，然后平稳收敛到后验概率 $p (z ∣ x)$ ，现在问题在于马氏链如何趋向于平稳分布，继续细化就是如何找到满足Detailed Balance的条件转移矩阵 $P=[p_{ij}]$ 让马氏链趋向于平稳分布。

为了得到能可平稳分布的条件概率转移矩阵 $P=[p_{ij}]$ ，先假设一个随机的条件概率转移矩阵 $Q=[q_{ij}]$ ，则会有：

在这里插入图片描述

为了让上述公式能够相等，引入 $\alpha(z,z_*)$ 和 $\alpha(z_*,z)$ ，使得

在这里插入图片描述

这样就找到了满足平稳分布的条件概率转移矩阵：

在这里插入图片描述

这里直接先给出结论，为了上式相等，则 $\alpha(z,z_*)$ 和 $\alpha(z_*,z)$ 的值为：

在这里插入图片描述

下面证明当 $\alpha(z,z_*)$ 和 $\alpha(z_*,z)$ 取上面值时，如下公式成立

在这里插入图片描述

至此寻找到了一个新的状态转移矩阵 $Q=[q_{ij}]$ 和 $\alpha(z,z_*)$ 、 $\alpha(z_*,z)$ 使得马尔科夫链趋向于平稳分布。

这样便可直接引入MCMC中的Metropolis Hastings MH采样方法，步骤如下：

a.先从（0,1）均匀分布中进行一次随机采样得到 $u$ ；

b.从状态转移矩阵 $Q=[q_{ij}]$ 对应的概率分布 $Q(z|z_{i-1})$ 中采样得到 $z_*$ ；

c.取值

在这里插入图片描述

注意：这里的 $p (z)$ 不是实际求出，而是归一化的 $\hat{p}(z)$ ，可以认为 $\hat{p}(z)$ 正比于 $p (z)$ ；

d.如果 $\alpha \geq u$ ，则本次采样的样本为 $z_i=z_{*}$ ，否则的话本次样本点为 $z_i=z_{i-1}$ ，即将上一次的采样样本作为本次的采样样本。

**总结：**所以MH采样方法的思想仍然是直接从后验分布 $p (z)$ 中无法采样，于是引入了可满足如下平稳分布：

在这里插入图片描述

然后按照上述方式进行采样，得到采样样本，就可以绕过后验概率 $p (z)$ 来计算目标期望值：
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。