贝叶斯地理统计模型INLA
本次博客主要讲述如何使用R-INLA软件进行空间分析,通过随机嵌套偏微分方程方法和集成的嵌套Laplace渐进法可为潜在高斯随机场模型中的边际分布提供准确而有效的估计。近年来已经广泛应用于空间流行病学领域。
由于笔者水平有限,关于理论部分,可前往link,针对数学公式及理论部分,这里不赘述,简化数学公式,强调如何应用,及在R语言里面如何实现。
安装INLA包
INLA官网The R-INLA project
如果在R里面下载速度非常慢,可以去 Index source 下载最新版Windows R-INLA 3.6里面,直接下载安装包
# 稳定版
install.packages("INLA", repos=c(getOption("repos"), INLA="https://inla.r-inla-download.org/R/stable"), dep=TRUE)
#测试版
install.packages("INLA", repos=c(getOption("repos"), INLA="https://inla.r-inla-download.org/R/testing"), dep=TRUE)
然后在RStudio里面 Tool->install.packages,选择下载的安装包即可。
简述
空间自相关是地理研究中的涉及到的普遍问题。Tobler的第一地理定律:
“所有事物都与其他事物有关,但附近的事物比远处的事物更相关。”
对于空间和时间上的对象都是如此,通常时间与空间是交互作用的。
我们知道,在流行病中,空间分析主要是对疾病数据进行空间上与时间上描述,找出相关性,绘制疾病风险地图,但是实际上空间分析非常复杂,计算量大且不容易直观体现。再叠加时间元素会让让人望而却步。R-INLA出现给解决此类问题提供了便捷的工具,INLA代表集成嵌套拉普拉斯逼近,我们将进一步了解其含义!
INLA使用确定性贝叶斯方法集成嵌套拉普拉斯近似法。
贝叶斯(Bayesian)=使用贝叶斯定理,与概率论相反。
是基于推断给定确定参数的数据集的概率(涉及设置先验!)。如想了解有关更多详细信息,您可以贝叶斯统计入门教程Bayesian Statistics。
1. 案例数据
我们使用gstat包里面自带的降雨数据,里面包含了467个测量站点信息,每个站点都会监测该点的降雨量,然后包含了该地区的海拔高度的图层,我们根据各个站点提取对应位置的海拔高度,然后将数据分成test与train,test1