数据是进行Meta分析制作森林图和漏斗图的前提,而数据提取就像一个盲人摸象的过程。为了防止个人提取数据产生的偏倚,制定一个详细的数据提取规则和数据提取表格是非常有必要的。如果想最低程度的降低提取数据造成的偏倚,需要根据文章具体的类型和目的设计数据提取表格。
01
基本原则
新手在提取数据时,要么是容易提取很多无关信息,要么是纳入信息少不够充分,分析时发现问题需要反复核查文献,因此我们在提取数据时需要遵循以下原则:
1. 明确需要纳入的数据;
2. 设计数据提取表格,定义提取的变量及数据提取规则;
3. 进行预实验,并据此修改和完善数据提取表格;
4. 由两人独立提取数据,如果在核对数据过程中出现争执,则需要通过两个人商量或者第三人参与从而使争执达成一致。当然,如果能够联系原作者进行数据确认,则是最好不过的
5. 所有过程均应妥善记录并保存。
02
提取内容
一个详细的数据提取表也是必不可少的,数据提取表需要包括哪些内容呢?
基本上来说应该包括以下5点:
1. 研究基本信息
包括一作、发表年份、文献来源、国家及资助来源等。
2. 研究对象特征
包括研究对象的基本特征,如性别构成、平均年龄、种族及疾病严重程度等。
3. 暴露或干预
包括评估方法,在研究人群中的分布,以及用药剂量等。
4. 研究结局
可能有多个结局,如有效率、生存率等,可以根据不同的研究和自己的需求提取。
5. 研究方法
如随机化方法,盲法使用情况,治疗方式,给药途径,剂量,疗程等;随访时长、随访率、暴露、结局及协变量的测量方法等。
6. 研究结果
1)二分类数据:Meta分析中,二分类变量汇总的是发生率、死亡率、有效率这些数据。
描述这样的数据。所以,对于二分类变量,试验组事件数、试验组样本量;对照组事件数和对照组样本量。分别对应试验组的分子和分母;对照组的分子和分母。然后,汇总两组分子和分母,进行分析。
2)连续型数据:如身高、体重、血压、血糖、血脂等,描述这样的数据,需要3个元素:均值、标准差和样本量。
所以,对于连续型变量,我们至少需要收集到:试验组的均值、标准差和样本量;对照组的均值、标准差和样本量。然后,汇总两组的均值,进行分析。
3)计数变量:如抛硬币正面朝上的次数,一个患者的心梗次数,一个患者的牙齿脱落次数
在同一个体上,某事件的重复发生“次数”,这种变量,是计数变量。可以分为两种:罕见事件(心梗)和常见事件(牙齿脱落)
常见事件:发生频繁,可视作连续型数据进行合并。比如在抛硬币实验中,“正面朝上”发生次数,这种变量发生频繁,可以将其视为连续型变量,用“平均数”来进行计算。
罕见事件:发生很少,可视作二分类数据进行合并。比如在糖尿病人群中“心梗”的发生次数,这种计数变量发生较少,可以作为“率”来进行分析。
4)等级变量:
等级变量如:轻、中、重;高、中、低;无效、有效、显效等。直接合并这种变量在方法学上还很难实现。所以,当等级少的时候,可将其转化为二分类变量;当等级多的时候,将其视作连续型变量来进行合并。
5)时间事件数据
有事件发生时间的一类数据,如:死亡时间、疾病进展时间,此类数据,可以用logHR及其标准误,合并效应量来计算。
总结:多数情况下,不同类型的数据最终都需要转化为二分类变量或连续型变量进行Meta分析。可能大家觉得很难的,不过小编建议大家从简单开始练习哦。
青椒医学统计专注医学统计。以医学统计学理论为基础,结合真实的医学数据实际案例,以案例文章、视频教学等形式,详细阐述医学统计原理、统计软件操作、统计分析结果撰写、医学统计图表制作等医学统计重难点问题,帮助广大医务工作者彻底解决医学统计中的各种难题。