r语言多元线性回归_R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归

最新推荐文章于 2024-04-21 00:00:00 发布

weixin_39805906

最新推荐文章于 2024-04-21 00:00:00 发布

阅读量307

点赞数

文章标签： r语言多元线性回归

本文链接：https://blog.csdn.net/weixin_39805906/article/details/111609679

版权

本文介绍了如何在R语言中应用Block Gibbs采样进行贝叶斯多元线性回归。详细阐述了贝叶斯模型、条件后验分布和模拟过程，并展示了Gibbs采样器的实现，通过模拟数据验证了估计器的性能。

摘要由CSDN通过智能技术生成

原文链接：

R语言中的block Gibbs吉布斯采样贝叶斯多元线性回归tecdat.cn

在这篇文章中，我将对多元线性回归做同样的事情。我将得出block的Gibbs采样器所需的条件后验分布。然后，我将对采样器进行编码，并使用模拟数据对其进行测试。

贝叶斯模型

假设我们有一个样本量的主题。贝叶斯多元回归假设该向量是从多元正态分布中提取的，通过使用恒等矩阵，我们假设独立的观察结果。正式地，

到目前为止，这与环境中看到的多元正态回归相同。则将概率最大化可得出以下解：

贝叶斯模型是通过指定为一个先验分布得到。在此示例中，我将在以下情况下使用先验值

block Gibbs

在对采样器进行编码之前，我们需要导出Gibbs采样器的每个参数的后验条件分布。

条件后验

取更多的线性代数。

这是一个非常漂亮和直观的结果。条件后验的协方差矩阵是协方差矩阵的频繁估计，

因此，在Gibbs采样器的每次迭代中，我们从后验画出一个完整的矢量。

模拟

我模拟的结果向量

运行 Gibbs采样器会生成对真实系数和方差参数的估计。运行了500,000次迭代。修整周期为100,000次，修整了10次迭代。

以下是MCMC链的图，其中真实值用红线表示。

# calculate posterior summary statistics (stats not used in rest of code) post_sum_stats<-post_dist %>% group_by(param) %>% summarise(median=median(draw), lwr=quantile(draw,.025), upr=quantile(draw,.975)) %>% mutate(true_vals=c(tb,tphi)) # merge on summary statistics post_dist <- post_dist %>% left_join(post_sum_stats, by='param') # plot MCMC Chains ggplot(post_dist,aes(x=iter,y=draw)) + geom_line() + geom_hline(aes(yintercept=true_vals, col='red'), show.legend=FALSE)+ facet_grid(param ~ .,scale='free_y',switch = 'y') + theme_bw() + xlab('Gibbs Sample Iteration') + ylab('MCMC Chains') + ggtitle('Gibbs Sampler MCMC Chains by Parameter')

这是修整后参数的后验分布：

ggplot(post_dist,aes(x=draw)) + geom_histogram(aes(x=draw),bins=50) + geom_vline(aes(xintercept = true_vals,col='red'), show.legend = FALSE) + facet_grid(. ~ param, scale='free_x',switch = 'y') + theme_bw() + xlab('Posterior Distributions') + ylab('Count') + ggtitle('Posterior Distributions of Parameters (true values in red)')