【Metropolis-Hastings 算法】基本原理 1.马尔可夫链理解

彬彬侠

已于 2024-12-21 23:00:40 修改

阅读量1.2k

点赞数 29

分类专栏：机器学习(笔记) 文章标签： Metropolis Hastings 算法马尔可夫链蒙特卡罗方法 MCMC 机器学习人工智能

于 2024-12-20 17:46:18 首次发布

本文链接：https://blog.csdn.net/u013172930/article/details/144616293

版权

机器学习(笔记) 专栏收录该内容

360 篇文章

订阅专栏

本文是将文章【Metropolis-Hastings 算法】中第一部分基本原理中的“1.马尔可夫链”，单独拿出来做一个详细的解析, 便于初学者更好的理解。

1. 问题背景

假设我们想从目标分布 $p (x)$ 中抽样，但直接采样困难，比如：

$p (x)$ 可能是一个复杂的概率密度函数；
$p (x)$ 的解析表达式难以处理。

为了解决这个问题，Metropolis-Hastings (MH) 算法通过构造一个马尔可夫链，使其平稳分布为 $p (x)$ ，从而间接生成符合 $p (x)$ 的样本。

2. Metropolis-Hastings 算法的核心思想

2.1 马尔可夫链的转移核

MH 算法的关键是定义一个转移核 $p (x, x^{'})$ ，通过它构造马尔可夫链：
$\alpha(x, x') \tag{19.38}$

其中：

$q (x, x^{'})$ ：建议分布（proposal distribution），决定了从当前状态 $x$ 到候选状态 $x^{'}$ 的采样方式；
$\alpha(x, x')$ ：接受分布（acceptance distribution），决定了是否接受候选状态 $x^{'}$ 。

2.2 接受概率

接受概率定义为：
$\alpha(x, x') = \min \left\{ 1, \frac{p(x')q(x', x)}{p(x)q(x, x')} \right\} \tag{19.39}$

含义：
- 如果候选状态 $x^{'}$ 的目标分布概率 $p (x^{'})$ 高于当前状态 $x$ 的概率 $p (x)$ ，则更有可能接受 $x^{'}$ ；
- 如果候选状态的概率较低，则仍有一定概率接受，从而避免陷入局部最优。

3. MH 算法的转移核具体形式

MH 算法的转移核 $p (x, x^{'})$ 具体为：
$\begin{cases} q(x, x'), & p(x')q(x', x) \geq p(x)q(x, x'), \\ q(x', x) \frac{p(x')}{p(x)}, & p(x')q(x', x) < p(x)q(x, x'). \end{cases} \tag{19.40}$

转移核解释

当候选状态 $x^{'}$ 被接受时：
- 转移概率与建议分布 $q (x, x^{'})$ 和目标分布的比值相关；
当候选状态被拒绝时：
- 当前状态 $x$ 保持不变，形成马尔可夫链的“停留”概率。

4. MH 算法的执行过程

4.1 采样步骤

初始化：选择一个初始状态 $x_0$ ；
迭代更新：
- 从建议分布 $q (x, x^{'})$ 中采样候选状态 $x^{'}$ ；
- 计算接受概率：
  $\alpha(x, x') = \min \left\{ 1, \frac{p(x')q(x', x)}{p(x)q(x, x')} \right\}$
- 从均匀分布 $\sim U(0, 1)$ 中抽样一个随机数：
  - 如果 $\leq \alpha(x, x')$ ，接受 $x^{'}$ 为新状态；
  - 否则，拒绝 $x^{'}$ ，保持当前状态 $x$ 。
生成样本：重复上述步骤，生成的样本序列 $\{x_1, x_2, \dots, x_t\}$ 会逐渐收敛到目标分布 $p (x)$ 。

4.2 特性

MH 算法生成的马尔可夫链是可逆的，满足细致平衡条件；
平稳分布为目标分布 $p (x)$ 。

5. MH 算法的性质与推导

5.1 可逆性与细致平衡条件

MH 算法的转移核 $p (x, x^{'})$ 满足以下细致平衡条件：
$\tag{19.41}$

证明过程：

假设 $\neq x'$ ，带入 $\alpha(x, x')$ 的定义：
$\min \left\{ 1, \frac{p(x')q(x', x)}{p(x)q(x, x')} \right\}$
根据 $\min(a, b)$ 的性质，重写为：
$p(x)p(x, x') = \min \{ p(x)q(x, x'), p(x')q(x', x) \}$
对称性：
$\min \left\{ 1, \frac{p(x)q(x, x')}{p(x')q(x', x)} \right\}$
化简后得：
$p (x) p (x, x^{'}) = p (x^{'}) p (x^{'}, x)$

结论：
MH 算法的马尔可夫链是可逆的，其平稳分布为目标分布 $p (x)$ 。

5.2 平稳分布的推导

根据细致平衡条件：
$p (x) p (x, x^{'}) = p (x^{'}) p (x^{'}, x)$
对 $x^{'}$ 积分，得：
$\int p(x)p(x, x') dx' = \int p(x')p(x', x) dx'$
化简后，证明 $p (x)$ 是平稳分布。

6. MH 算法的总结

算法核心：
通过建议分布 $q (x, x^{'})$ 和接受概率 $\alpha(x, x')$ ，构造一个马尔可夫链，该链的平稳分布为目标分布 $p (x)$ 。
公式总结：
1. 接受概率：
  $\alpha(x, x') = \min \left\{ 1, \frac{p(x')q(x', x)}{p(x)q(x, x')} \right\}$
2. 转移核：
  $\begin{cases} q(x, x'), & p(x')q(x', x) \geq p(x)q(x, x'), \\ q(x', x) \frac{p(x')}{p(x)}, & p(x')q(x', x) < p(x)q(x, x'). \end{cases}$
特点：
- 适用于复杂分布的采样；
- 能够避免陷入局部最优，通过概率接受较差的候选状态；
- 保证平稳分布与目标分布一致。