背景
诸如核密度估计(KDE)的平滑方法被用于控制用于计算每种疾病率的空间支持的群体基础。平滑程度由用户定义的参数(带宽或阈值)控制,该参数影响疾病图的分辨率和计算的速率的可靠性。
方法
内核,带宽的大小,是影响在KDE [在地图上的平滑的程度的关键参数 ]。带宽可以是固定的也可以是可变的(自适应的)。对于固定带宽方法,内核具有固定大小的半径,并且所有内核(圆圈)具有相同的半径。在健康研究中,固定带宽方法可能不合适,因为人口不是均匀分布在地理空间中。此外,如果圆圈落入低人口密度区域,可能会导致不稳定的比率。类似地,在自适应带宽方法中,内核半径增大或缩小以适应不同的种群大小。用于定义内核带宽的最小种群大小,以及因此地图上的平滑程度,是用户定义的参数。我们将其称为阈值(h)。
图 显示了使用疾病控制和预防中心(CDC),国家卫生统计中心(NCHS) 获得的65岁及以上男性心脏病死亡率的空间分布。我们使用具有不同阈值的自适应核密度估计方法产生该映射。
#自适应平滑
bivariate. ( ,h0=1.5,hp=1,adapt=TRUE,davies.baddeley=0.025)
## 带宽选择##
###全局(用于自适应)带宽选择##
# ~200 secs next line; 使用“并行化”来加速
system.time( <- BOOT. (pbc,type=" ")) # 自适应引导的最小用法
# ~80 secs 设置自定义h限制; 增加参考带宽
plot(hada);abline(v=hada[which.min(hada[,2]),1],col=2)
模拟基线速率和真实值(RMSE)之间的差异幅度随着L的增加而稳定。在本研究中,当L > 50时,所有年龄组均