介绍
在对诊断测试准确性的系统评价中,统计分析部分旨在估计测试的平均(跨研究)敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关,这表明需要相关数据模型。由于用户,分析在统计上具有挑战性
-
处理两个摘要统计,
-
必须考虑敏感性和特异性之间的相关性,
-
必须考虑到研究中的敏感性和特异性的异质性
-
应该允许纳入协变量。
相关视频:Copula算法原理和R语言股市收益率相依性可视化分析
Copula算法原理和R语言股市收益率相依性可视化分析
,时长16:34
本教程介绍并演示了用于诊断准确性研究的荟萃分析的分层混合模型。在层次结构的第一级中,给定每个研究的灵敏度和特异性,两个二项分布用于分别描述患病和健康个体中真阳性和真阳性样本数的变化。在第二级,我们使用二元分布模拟未观察到的敏感性和特异性。虽然使用了分层模型,但meta分析的重点在于研究中的汇总平均值,而在给定的研究估算中很少。
相关视频:线性混合效应模型(LMM,Linear Mixed Models)和R语言实现
线性混合效应模型(LMM,Linear Mixed Models)和R语言实现案例
时长12:13
使用来自两个先前发布的meta分析的数据集来演示这些方法:
-
尿液中端粒酶的诊断准确性作为诊断原发性膀胱癌的肿瘤标志物,因为它是一个有问题的数据集,其相关参数估计为-1并且没有协变量而引起收敛问题(Glas et al.2003)
-
比较病毒检测(使用HC2检测)的敏感性和特异性与重复细胞学检查对具有宫颈病变的女性进行分类,以检测潜在的宫颈癌前病变(Arbyn等,2013)。第二个数据集用于证明具有一个协变量的元回归,该协变量可以自然地扩展到包括几个协变量。
荟萃Meta 分析的统计方法
推理框架和软件
由于其灵活性和MCMC模拟的使用,复杂建模通常可以在贝叶斯框架内更容易地实现。通过控制先验分布,贝叶斯推断可以规避可识别性问题,而没有先验分布的频率推理中的数值逼近算法可能会因识别性问题而陷入困境。然而,贝叶斯方法通常需要统计专业知识和耐心,因为MCMC模拟是计算密集型的。相反,最频繁的方法已被包含在标准“程序”中,这些程序需要较少的统计知识和编程技能。此外,频率论方法通过最大似然估计(MLE)进行优化,与MCMC模拟相比,其具有更短的运行时间。
JAGS (Plummer等人2003)是Stan的另一种可扩展的通用采样引擎。扩展JAGS
需要知道C++
动态链接库(DLL)模块。根据经验,配置和构建模块是一项艰巨而繁琐的任务,尤其是在Windows操作系统中。上述缺点加上这样的事实,Stan
即使从较差的初始值开始,往往会以较少的迭代收敛。
模型诊断
为了评估链的模型收敛和平稳性,有必要检查潜在的比例缩减因子,有效样本大小(ESS),MCMC误差和参数的跟踪图。当所有链达到目标后验分布时,估计后验方差接近于链方差,使得两者的比率接近1,表明链是稳定,可能已达到目标分布。有效的样本大小表示实际上有关某个参数的信息量。当样本自动相关时,期望参数后验分布的信息少于样本独立时的信息。由于模拟了后验分布,因此近似值有可能偏离一定量;MCMC误差接近0表示可能已达到目标分布。
模型比较和选择
Watanabe-Alkaike信息准则(WAIC)(Watanabe 2010)是一种最近的模型比较工具,用于测量拟合模型在贝叶斯框架中的预测精度,用于比较模型。WAIC可以被视为对Deviance Information Criterion(DIC)的改进,尽管流行,但它已经存在一些问题(Plummer 2008)。WAIC是一个完全贝叶斯工具,非常接近贝叶斯交叉验证,对重新参数化不变,可用于简单以及分层和混合模型。
数据集
端粒酶数据
(Glas等,2003)系统地回顾了细胞学和其他标志物(包括端粒酶)对膀胱癌初步诊断的敏感性和特异性。他们报告说,端粒酶有敏感性和特异性分别为0.75
,和0.86
。他们得出结论,端粒酶不够灵敏,不宜用于日常使用。
将数据加载到R环境中并生成以下输出
## ID TP TN FN FP
## 1 1 25 25 8 1
## 2 2 17 11 4 3
## 3 3 88 31 16 16
## 4 4 16 80 10 3
## 5 5 40 137 17 1
## 6 6 38 24 9 6
## 7 7 23 12 19 0
## 8 8 27 18 6 2
## 9 9 14 29 3 3
## 10 10