马尔可夫链蒙特卡罗法
在统计学和计算领域,马尔可夫链蒙特卡罗法(Markov Chain Monte Carlo,简称MCMC)是一种强大的工具,它允许我们从复杂的概率分布中抽取样本。本文将介绍MCMC的基本概念、基本步骤以及它在统计学习中的应用。
要解决的问题
给定一个多元随机变量 ( x ),其概率密度函数为 ( p(x) ),我们的目标是获得该分布的样本集合,并计算某个函数 ( f(x) ) 的数学期望 ( E_{p(x)}[f(x)] )。
基本想法
MCMC的基本想法是在状态空间 S 上定义一个马尔可夫链 ( X = {X_0, X_1, X_2, …} ),使其平稳分布与目标分布 ( p(x) ) 相同。然后,通过在该马尔可夫链上进行随机游走来产生样本序列。
基本步骤
马尔可夫链蒙特卡罗法(MCMC)的核心思想可以通过以下公式进行总结:
马尔可夫链蒙特卡罗法 (MCMC) 核心思想总结
定义马尔可夫链
首先,定义一个马尔可夫链 ( X = {X_0, X_1, X_2, …} ),其中每个状态 ( X_t ) 表示随机变量 ( x ) 在时间 ( t ) 的状态。
平稳分布
确保该马尔可夫链的平稳分布 ( \pi(x) ) 与目标分布 ( p(x) ) 相同。
随机游走
从初始状态 ( X_0 ) 开始,通过马尔可夫链进行随机游走,得到一系列状态 ( X_0, X_1,…, X_t, …)。
遍历定理
根据遍历定理,随着时间 ( t ) 趋于无穷大,马尔可夫链的状态分布 ( P(X_t = x) ) 将趋近于平稳分布 ( \pi(x) )。
烧入期
在时间 ( t > m )(其中 ( m ) 是一个正整数,称为烧入期)之后,系统达到平稳状态。
抽样和期望计算
在时间 ( m < t <= n )(其中 ( n ) 是一个大于 ( m ) 的正整数)内收集的样本集合 ( {x_{m+1}, x_{m+2}, …, x_n} ) 可以用来近似目标分布 ( p(x) )。
数学期望的估计
使用这些样本来估计函数 ( f(x) ) 关于分布 ( p(x) ) 的数学期望 ( E{p(x)}[f(x)] ),即:
这个公式表示,通过足够长时间的随机游走,我们可以得到一个样本集合,其函数均值(遍历均值)可以作为目标分布函数数学期望的估计。
总结
MCMC是一种强大的统计学习计算方法,它通过模拟马尔可夫链的随机游走来从复杂的概率分布中抽取样本