缺失数据7 | 临床试验数据缺失数据如何填补?顶刊JAMA论文中的文献解读

编者

临床试验实施过程中,由于受试对象在试验中因依从性差、不良事件或疗效不佳等原因提前退出试验;采集标本或测量过程中因样本量不足或灵敏度不够所造成的疗效指标缺失;在数据记录或整理过程中造成的数据丢失等上述情况都会造成数据的缺失。

今天,我们通过对一篇医学顶刊JAMA的临床试验研究论文的文章解读,分享应对临床试验缺失数据填补的统计学方法!

数据缺失会对数据分析带来不利的影响,包括引起偏倚(Bias),影响试验效率(降低检验效能,影响数据的变异程度),影响对目标总体的代表性,从而影响研究结果的外部有效性。

对于临床试验进行中出现的受试者可能出现的脱落、未正常完成试验等复杂的实际情况,统计分析时可以采用多种数据集,针对不同的分析人群进行。

临床试验的统计分析数据集分为意向性分析集(Intention To Treat Principle,简称ITT)、全分析集(Full Analysis Set,简称FAS)、符合方案集(Per Protocol Set,简称PPS)、安全性分析集(Safety Set,简称SS)。

本公众号回复“立春”即可获得“立春”临床统计学沙龙PPT,数据等资料

案例分享

2020年5月,美国加利福尼亚大学学者在医学顶刊《The New England Journal of Medicine》(一区,IF=158.5)发表题为:"Randomized Trial of Lactin-V to Prevent Recurrence of Bacterial Vaginosis" 的临床试验研究论文。

99de16b8876263cd87eca7b689a31c1c.png

 一、摘要

标题:Lactin-V 预防细菌性阴道病复发的随机试验

背景: 细菌性阴道病影响 15% 至 50% 的育龄女性,抗生素治疗后常见复发。复发率高表明需要新的治疗方法来预防复发性细菌性阴道病。

方法:我们进行了一项随机、双盲、安慰剂对照 2b 期试验,以评估卷曲乳杆菌 CTV-05 (Lactin-V) 预防细菌性阴道病复发的能力。18 至 45 岁之间,被诊断为细菌性阴道病并已完成阴道甲硝唑凝胶疗程(作为资格要求的一部分)的女性,按 2:1 的比例被随机分配接受阴道给药的 Lactin-V 或安慰剂11周;随访持续到第 24 周。主要结果是到第 12 周时细菌性阴道病复发的女性百分比。

结果:共有 228 名女性接受了随机分组:152 名进入 Lactin-V 组,76 名进入安慰剂组;在这些参与者中,Lactin-V 组中 88% 的参与者和安慰剂组中 84% 的参与者可以评估主要结局。在意向治疗人群中,Lactin-V 组有 46 名参与者 (30%) 和安慰剂组有 34 名参与者 (45%) 到第 12 周时细菌性阴道病复发(针对缺失反应进行多重插补后的风险比, 0.66;95% 置信区间 [CI],0.44 至 0.87;P=0.01)。第 24 周时复发的风险比(也通过缺失反应的多重插补计算)为 0.73(95% CI,0.54 至 0.92)。在为期 12 周的访视中,Lactin-V 组中 79% 的参与者检测到卷曲乳杆菌 CTV-05。到第 24 周时,发生至少一种与 Lactin-V 或安慰剂相关的不良事件的参与者百分比在各组之间没有显著差异。两组中出现局部或全身不良事件的参与者比例相似。

结论:阴道甲硝唑治疗后使用 Lactin-V 导致 12 周时细菌性阴道病复发率显著低于安慰剂。

二、研究设计

多中心、随机、双盲、安慰剂对照 Ⅱb 期试验 (2016 年 4 月~ 2019 年 2 月,四个临床中心)

受试对象(P):228名细菌性阴道病(BV)女性患者,5天0.75%甲硝唑标准治疗后;

干预(I)LACTIN-V 2x109CFU阴道给药器给药;

对照(C):含有与实验组相同的非活性成分;

终点指标(O):到第 12 周时、第 24 周就诊时,细菌性阴道病复发的女性百分比;主要安全性结果是在第 24 周时发生至少一种被认为与 Lactin-V 或安慰剂相关的不良事件的参与者的百分比。

2cc2cf229112507a25818940e73e8fa8.png

三、研究结果

1. 基线特征

共有 522 名女性接受了筛查,其中 4 个试验中心的 228 名女性接受了随机分组:152 名被分配到 Lactin-V 组,76 名被分配到安慰剂组。

d1b5c9decd56ab427b8f2170aab01074.png

2.疗效和安全性

(1)在第12周,Lactin-V组有30%的女性(46/152)BV复发,安慰剂组有45%的女性(34/76)BV复发;

(2)和使用安慰剂相比,使用Lactin-V后第12周BV复发的风险降低了36%,第24周复发的风险降低了27%

3580f368f17d871b96d7b570d2d98882.png

(3)在使用Lactin-V后第12周,79%的女性可在阴道中检测到卷曲乳杆菌 CTV-05;

c129c870f51a53cb06baecea61f585a3.png

 (4)不良反应(包括阴道分泌物异常、外阴灼烧感和瘙痒等),在两组间发生率相似。

0fb105cbb079dfddebab198437f66b78.png

431902ec62dc60e3a29880af2abe9da6.png

统计学方法

四、统计学方法

1.样本量计算时的考虑

  • 2:1的分组比例,对比安慰剂组的优效性设计

  • 研究者基于全分析集人群中 10% 的预期退出率,以及安慰剂组参与者在第 12 周时细菌性阴道病复发的假设累积百分比为 30%。

  • 在 228 名参与者的样本中,该试验将有 70% 的检验效能(β=0.3)检测到第 12 周时细菌性阴道病复发的参与者的累积百分比,Lactin-V 组比安慰剂组低 50%,使用以α=0.05 检验水平的双侧 Pearson 卡方检验

4188ffecc10d3eceddf8183a848d4d18.png

2.结局指标的假设检验

计算每个治疗组 12 周和 24 周就诊时细菌性阴道病复发的参与者的累积百分比,以及风险比和 95% 置信区间

Pearson 的卡方检验用于检验零假设,即在第 12 周和第 24 周时,Lactin-V 组中细菌性阴道病复发的参与者的累积百分比将等于安慰剂组中的参与者,并采用双面备择假设。基于样本估算时采用的检验效能70%(β=0.3),以α=0.05为检验水平进行双侧检验。

04c60bce2f69059b5911d2e2928b2ded.png

3.数据缺失填补——单一插补法

  • 在登记的女性中,14% 的人不符合主要结局分析的资格,这一比例高于用于估计样本量的假设百分比 10%。

  • 对于意向治疗人群和改良意向治疗人群的分析,当细菌性阴道病的诊断缺失时,使用两种单一插补方法对数据进行插补,其中一种是前一次观察数据向后结转(last observation carried forward,LOCF)。

567e1a907c523dfc05aa42e0c624481f.png

4.多重填补法敏感性分析

在进行缺失数据处理之后,需要对结果进行事后敏感性分析,以计算风险比和相应的置信区间,判断处理方法的合理性和可靠性。

在假设缺失数据单调模式的情况下,使用逻辑回归多重插补进行假设检验。

将多重插补分析和多项敏感性分析的结果与全分析集(FAS)的结果比较是否一致。文章中介绍了事后多重填补分析的结果,该分析证实了前一次观察数据向后结转。

6bca804150396a74cb31234d1e67f770.png

8f1d1eac5af889173472e61b6965e64f.png

99df1ad237d3a6547e3dd8ac058db683.png

*在假设缺失数据单调模式的情况下,使用逻辑回归多重插补计算风险比,95% 置信区间(CI)未针对多重性进行调整

5.不同分析集的主要结果比较

将意向治疗分析的主要结果与意向治疗(最后观察结转)分析集、修改意向治疗集、完整病例集和符合方案分析集的结果进行比较。多个数据集结果的比较在一定程度上也可称为敏感性分析。

6adf5a2a64c60ff388c99bd7a530f608.png

035a8bd500d0f7050980f75c87a0cd1f.png

6.亚组分析

对指定治疗的依从性(给予剂量的≥的75%与给予剂量的<75%)、自上次就诊以来报告的月经发生(月经与没有月经)以及报告的性行为(不使用避孕套的性行为与禁欲或使用避孕套的性行为)之间的关系进行分层和探索性分析

1bb4cda094e3f7ca1e601c48387d4999.png

a729a46bb238cd8429255abc9b2abeff.png

文章小结

1.前一次观察数据向后结转(last observation carried forward,LOCF)

是单一插补法的一种,将缺失数据前一次的观测值直接拿来进行替代填补, 方法虽简单, 但是严格满足两个条件:

  • 缺失数据属于完全随机缺失

  • 数据缺失之后的各时间点观测值均为能够访视到的最后一次时间点的观测值。若不满足第二条件,该方法的缺陷也显而易见,填充的数据会违背真实趋势,而这一条件在实际工作中较难实现,往往需要病例脱落时已处于平台期。

给每个缺失值都构造m个插补值(m>1), 根据每个插补值都产生一个完整数据集;

d117529acfb7d6a45a9e3fd29c84471b.png

2.多重填补法(multiple imputation,MI)

指对缺失数据进行多次填补后, 对多个填补后数据集进行统计分析和结果合并,适用于满足完全随机缺失和随机缺失的缺失数据。

多重填补法一般包括数据填补和合并分析两个步骤:

  • 首先根据已观察到的数据来估计缺失数据的分布状态,利用合适的填补模型(模型根据数据缺失的机制来决定)进行 N 次填补。

  • 在合并分析中, 首先对 N 个填补后数据集进行统计分析, 再对 N 次分析的结果进行合并。

343a63447849bf6f60edeeab4f6f964a.png

3.多重填补敏感性分析的基本步骤:

多重填补敏感性分析的过程与多重填补的完全相同,主要区别在于产生缺失数据的填补值所基于的分布不同。

  • 第一步,产生缺失数据的填补值:基本思路为构建一个非随机缺失模型,基于该模型产生缺失数据的填补值。

  • 第二步:对缺失数据集进行 m 次填补,产生 m 个填补好的“完整数据集”,对每个填补后的“完整数据集”分别采用合适的统计方法进行分析,得到每个“完整数据集”对应的参数估计值等指标。

  • 第三步:根据一定的规则将m组统计分析结果进行综合,得出最终结论。

在多重填补的敏感性分析中上述方法较为常用,被 美 国 医 学 会 杂 志 (Journal of the American Medical Association,JAMA),内 科 学 年 鉴 (Annals of Internal Medicine)等高影响因子杂志所推荐。

本公众号回复“立春”即可获得“立春”临床统计学沙龙PPT,数据等资料

本公众提供各种科研服务了!

一、课程培训

2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课。如果您有需求,不妨点击查看:

发文后退款:2024-2025年科研统计课程介绍

二、数据分析服务

浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情:

课题、论文、毕业数据分析 

 临床试验设计与分析 公共数据库挖掘与统计

  • 8
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值