Gibbs Sampling

最新推荐文章于 2024-06-09 23:26:16 发布

泥壶映雪

最新推荐文章于 2024-06-09 23:26:16 发布

阅读量282

点赞数

分类专栏： R 机器学习统计学文章标签：概率论机器学习算法

本文链接：https://blog.csdn.net/weixin_46649908/article/details/130594715

版权

R 同时被 3 个专栏收录

37 篇文章 3 订阅

订阅专栏

统计学

15 篇文章 1 订阅

订阅专栏

机器学习

7 篇文章 0 订阅

订阅专栏

Gibbs Sampling

文章目录

Gibbs Sampling
@[toc]
1 Gibbs算法
1.1 二阶段Gibbs
1.2 多阶段Gibbs

2 代码实现

1 Gibbs算法

1.1 二阶段Gibbs

已知二维随机向量 $X_1,X_2)$ 服从联合概率分布 $f(x_1,x_2)$ ,对应的边缘概率密度函数为
$f(x_1) = \int f(x_1,x_2)dx_2\\ f(x_2) = \int f(x_1,x_2)dx_1;$
则可以计算出随机变量 $X_1$ 和 $X_2$ 的条件概率分布：
$\begin{aligned} f(x_1|x_2) = \dfrac{f(x_1,x_2)}{f(x_2)}=\dfrac{f(x_1,x_2)}{\int f(x_1,x_2)dx_1}\\ f(x_2|x_1) = \dfrac{f(x_1,x_2)}{f(x_1)}=\dfrac{f(x_1,x_2)}{\int f(x_1,x_2)dx_2} \end{aligned}$
二阶段Gibbs算法如下：

（1）给定初始值 $x_1^0,x_2^0)$ ，

（2）对应 $t=2,3\dots N$ ,

从条件密度 $f(x_1|x_2^{t-1})$ 采样得到 $x_1^t$
从条件密度 $f(x_2|x_1^{t})$ 采样得到 $x_2^t$

根据上面的算法得到样本 $\{\boldsymbol{x^t} = (x_1^t,x_2^t)|0\le t\le N\}$ 。不难发现，下一期 $x^{t+1}$ 仅仅取决于当前 $x^t$ 的取值，而与过去时刻取值无关，这种性质具有马尔可夫链的性质。因此，二阶段Gibbs采样也属于马尔科夫链蒙特卡洛模拟(MCMC)采样。为保证采样结果收敛到目标分布，前一段时间的采样应该舍去。

1.2 多阶段Gibbs

类似地可以得到多阶段Gibbs算法：

（1）给定初始值 $(x_1^0,x_2^0\dots x_n^0)$ ，

（2）对应 $t=2,3\dots T$ ,

从条件密度 $f(x_1|x_2^{t-1},x_3^{t-1}\dots x_n^{t-1})$ 采样得到 $x_1^t$ ;
从条件密度 $f(x_2|x_1^{t},x_3^{t-1}\dots x_n^{t-1})$ 采样得到 $x_2^t$ ;
……
从条件密度 $f(x_n|x_1^{t},x_3^{t}\dots x_{n-1}^{t})$ 采样得到 $x_n^t$ ;

为保证采样结果收敛到目标分布，前一段时间的采样应该舍去。

2 代码实现

以二元正态分布为例。已知二元随机变量 $x_1,x_2)$ 满足二元联合正态分布，均值分别为 $\mu_1=2,\mu_2=1.5$ ，方差为 $\sigma_1=3,\sigma_2=5$ ，相关系数 $\rho=-0.5$ 。使用Gibbs方法进行采样。对于一般二维正态分布
$y)=\frac{1}{2 \pi \sigma_x \sigma_y \sqrt{1-\rho^2}} \exp \left(-\frac{1}{2\left(1-\rho^2\right)}\left[\frac{\left(x-\mu_x\right)^2}{\sigma_x^2}-2 \rho \frac{\left(x-\mu_x\right)\left(y-\mu_y\right)}{\sigma_x \sigma_y}+\frac{\left(y-\mu_y\right)^2}{\sigma_y^2}\right]\right)$
在 $x$ 条件下。 $y$ 的条件分布也为正态分布(一维)：
$\mid x)=\frac{1}{\sqrt{2 \pi} \sigma_{y \mid x}} \exp \left(-\frac{\left(y-\mu_{y \mid x}\right)^2}{2 \sigma_{y \mid x}^2}\right)$
其中条件均值：
$\mu_{y \mid x}=\mu_y+\rho \frac{\sigma_y}{\sigma_x}\left(x-\mu_x\right)$
条件方差：
$\sigma_{y \mid x}=\sigma_y \sqrt{1-\rho^2}$
即
$\begin{aligned} y|x\sim N(\mu_y+\rho \frac{\sigma_y}{\sigma_x}\left(x-\mu_x\right),\sigma_y \sqrt{1-\rho^2})\\ x|y\sim N(\mu_x+\rho \frac{\sigma_x}{\sigma_y}\left(y-\mu_x\right),\sigma_x \sqrt{1-\rho^2}) \end{aligned}$

#二阶段Gibbs抽样
x1  <- numeric()
x2 <- numeric()
rho = 0.6;mu1 = 1.1;sigma1 = 3;mu2 = 1.8;sigma2 = 4
x1[1] = 0
x2[1] = 0
N = 5000
for(t in 2:N){
  print(t)
  x1[t] = rnorm(1,mean = mu1+rho*sigma1/sigma2*(x2[t-1]-mu2),
                sd = sqrt(1-rho^2)*sigma1)
  x2[t] = rnorm(1,mean = mu2+rho*sigma2/sigma1*(x1[t]-mu1),
                sd = sqrt(1-rho^2)*sigma2)
}
cor(x1,x2)
plot(x1,x2)
grid(col = "black")
# 样本期望、方差
mean(x1[1001:2000])
mean(x2[1001:2000])
sd(x1[1001:2000])
sd(x2[1001:2000])

参考书籍：