我理解的马尔科夫链蒙特卡洛（MCMC,Markov Chain Monte Carlo）

最新推荐文章于 2024-09-27 19:53:53 发布

多读多写多思考

最新推荐文章于 2024-09-27 19:53:53 发布

阅读量3.7k

点赞数

分类专栏：琐碎知识文章标签：马尔科夫链蒙特卡洛 MCMC 参数估计

本文链接：https://blog.csdn.net/LXX516/article/details/103711049

版权

琐碎知识专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文是From Scratch: Bayesian Inference, Markov Chain Monte Carlo and Metropolis Hastings, in python的阅读笔记

马尔科夫链蒙特卡洛（MCMC, Markov Chain Monte Carlo）的定义是：通过在概率分布中进行采样，估计给定观测数据下模型的参数。（MCMC is a class of techniques for sampling from a probability distribution and can be used to estimate the distribution of parameters given a set of observations.）

MCMC是用来估计模型（概率分布）的参数的，由于不方面直接计算模型参数，所以通过“设想”一组可能的参数值（依从某种概率分布进行采样）近似参数分布，即蒙特卡洛部分。“设想”（采样）是有指导原则的，根据当前采样的参数值以及参数的先验，去采样下一个参数值，具有马尔科夫链的性质。

蒙特卡洛通过不断地生成随机数来估计难以直接计算的量，如模型参数，积分等等。如要计算以下圆形的面积，知道圆形在正方形内，产生一些随机点，计算落在圆形区域内点的占比，乘以正方形的面积就可近似圆形的面积。

以上采样到底是怎么实现的呢？常用方法之一是M-H采样（Metropolis-Hastings）。

M-H采样

因为我们估计的是参数的分布，用一组可能的取值表示，这个分布就是模型参数A在给定数据集D下的后验分布P(A=a|D). 这组参数值的采样过程是：根据当前参数值a和参数先验P(a)去估计下一个参数值a1，对当前参数的依赖性由一个转移模型（transition model）Q(a1|a)来决定，也称为proposal distribution。若采样得到的新样本a1比当前样本a的可能性高，则接受该新样本，太低的话就拒绝，这个评估依据就是P(a1|D)/P(a|D)，根据贝叶斯准则：