R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

拓端研究室TRL

已于 2022-11-22 18:40:11 修改

阅读量475

点赞数

分类专栏：拓端拓端tecdat 拓端数据文章标签： r语言开发语言

于 2022-10-25 09:57:31 首次发布

本文链接：https://blog.csdn.net/tecdat/article/details/127507710

版权

介绍

在对诊断测试准确性的系统评价中，统计分析部分旨在估计测试的平均（跨研究）敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关，这表明需要相关数据模型。由于用户，分析在统计上具有挑战性

处理两个摘要统计，
必须考虑敏感性和特异性之间的相关性，
必须考虑到研究中的敏感性和特异性的异质性
应该允许纳入协变量。

荟萃Meta 分析的统计方法

推理框架和软件

由于其灵活性和MCMC模拟的使用，复杂建模通常可以在贝叶斯框架内更容易地实现。通过控制先验分布，贝叶斯推断可以规避可识别性问题，而没有先验分布的频率推理中的数值逼近算法可能会因识别性问题而陷入困境。然而，贝叶斯方法通常需要统计专业知识和耐心，因为MCMC模拟是计算密集型的。相反，最频繁的方法已被包含在标准“程序”中，这些程序需要较少的统计知识和编程技能。此外，频率论方法通过最大似然估计（MLE）进行优化，与MCMC模拟相比，其具有更短的运行时间。

JAGS （Plummer等人2003）是Stan的另一种可扩展的通用采样引擎。扩展JAGS需要知道C++动态链接库（DLL）模块。根据经验，配置和构建模块是一项艰巨而繁琐的任务，尤其是在Windows操作系统中。上述缺点加上这样的事实，Stan即使从较差的初始值开始，往往会以较少的迭代收敛。

模型诊断

为了评估链的模型收敛和平稳性，有必要检查潜在的比例缩减因子，有效样本大小（ESS），MCMC误差和参数的跟踪图。当所有链达到目标后验分布时，估计后验方差接近于链方差，使得两者的比率接近1，表明链是稳定，可能已达到目标分布。有效的样本大小表示实际上有关某个参数的信息量。当样本自动相关时，期望参数后验分布的信息少于样本独立时的信息。由于模拟了后验分布，因此近似值有可能偏离一定量;MCMC误差接近0表示可能已达到目标分布。

模型比较和选择

Watanabe-Alkaike信息准则（WAIC）（Watanabe 2010）是一种最近的模型比较工具，用于测量拟合模型在贝叶斯框架中的预测精度，用于比较模型。WAIC可以被视为对Deviance Information Criterion（DIC）的改进，尽管流行，但它已经存在一些问题（Plummer 2008）。WAIC是一个完全贝叶斯工具，非常接近贝叶斯交叉验证，对重新参数化不变，可用于简单以及分层和混合模型。

数据集

端粒酶数据

（Glas等，2003）系统地回顾了细胞学和其他标志物（包括端粒酶）对膀胱癌初步诊断的敏感性和特异性。他们报告说，端粒酶有敏感性和特异性分别为0.75 ，和0.86。他们得出结论，端粒酶不够灵敏，不宜用于日常使用。

将数据加载到R环境中并生成以下输出

##    ID TP  TN FN FP
## 1   1 25  25  8  1
## 2   2 17  11  4  3
## 3   3 88  31 16 16
## 4   4 16  80 10  3
## 5   5 40 137 17  1
## 6   6 38  24  9  6
## 7   7 23  12 19  0
## 8   8 27  18  6  2
## 9   9 14  29  3  3
## 10 10

最低0.47元/天解锁文章

拓端研究室TRL

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究

在对诊断测试准确性的系统评价中，统计分析部分旨在估计测试的平均（跨研究）敏感性和特异性及其变异性以及其他测量。灵敏度和特异性之间往往存在负相关，这表明需要相关数据模型。由于用户，分析在统计上具有挑战性处理两个摘要统计，必须考虑敏感性和特异性之间的相关性，必须考虑到研究中的敏感性和特异性的异质性应该允许纳入协变量。相关视频：Copula算法原理和R语言股市收益率相依性可视化分析Copula算法原理和R语言股市收益率相依性可视化分析，时长16:34。
复制链接

扫一扫