直播预告
这是公众号缺失数据处理系列文章第5篇,我们翻译了一篇写得不错得文字:临床试验数据,存在着缺失结果时,如何分析、如何报告。
评价药物治疗效果的金标准研究设计是随机试验。治疗组的分配是一个随机过程,预后因素的基线差异是偶然的。因此,在基线时,两组在研究结局的已知和未知预后因素方面预计在统计学上具有可比性。为了保持这一预期的可比性,通常的做法是根据分配的治疗组分析参与者数据(即意向治疗原则)。然而,可能会出现失访(即结局未知的患者)。
国家研究委员会的一个小组对这个问题进行了深入讨论,并在最近发表了评论。该报告列出了一些可采取的预防措施,以减少后续损失。然而,无论采取何种预防措施,结局缺失几乎都是不可避免的(例如,如果患者未回来接受随访),结局信息的缺失可能达到50%。在本文中,我们的目的是解释和说明随机试验分析中缺失结局的主要问题、可能的解决方案以及应该报告什么。
本公众号回复“立春”即可获得“立春”临床统计学沙龙PPT,数据等资料 |
完整病例意向治疗分析
无论一项研究是随机试验还是观察性随访,两种设计的主要问题都是患者失访。患者退出的原因可能与他们的预后有关。如果退出的患者的特征在治疗组间存在差异,则留在研究中的患者的预后可能不再具有可比性,可能导致对治疗效果的错误估计。即使在基线时达到了预后因素的完美平衡,并进行了意向治疗分析,情况仍然如此。
意向治疗分析仅表明根据分配给参与者的治疗对参与者数据进行分析。“意向治疗”这一术语不包含在分析中怎么处理缺失结局的信息,而缺失结局的参与者通常被从分析中省略。这就产生了“完整的病例意向治疗分析”。
意向性[治疗]分析(intention-to-treat analysis,ITT analysis),对所有符合方案要求经随机分组进入研究、开始治疗的病例进行统计分析,以对临床实践中可能出现的结果进行评价。
案例介绍
1.一个由于缺失结局而导致偏倚的例子
我们用一个简单的例子说明,结局数据的缺失如何导致对治疗效果的偏倚估计(表1)。
假设开展了一项纳入2,000名参与者的安慰剂对照随机试验,目的是评估活性药治疗对某一结局的影响。
由于随机分组,每个治疗组的男性和女性人数相等。
性别是结局的危险因素:男性的风险是女性的3倍(安慰剂组分别为30%和10%)。
如果所有患者的结局数据均可获得(情景1),则观察到保护性治疗效果(风险比[RR] 0.80)。
表1中的场景2显示了一个结局数据缺失的极端例子,即活性药治疗组的所有女性均失访(因为她们更容易发生药物不良反应)。
结果,治疗组的事件风险被高估了(24%而不是16%),因为只有结局高危的个体仍然存在。
因此,观察到的治疗效果是存在偏倚的(RR 1.20),表明治疗有有害的影响,即使治疗实际上是有保护作用的。
如果发生相反的情况(即治疗组的所有男性均失访),则观察到的治疗效果将存在严重偏倚(RR 0.40)。
该例子表明,由于缺失的结局数据所造成的偏倚可能会导致对治疗效果的高估或低估。我们无需将活性药治疗组中未观察到结局的所有女性从分析中剔除,而是可以很容易地实施(不现实的)假设,即该组中所有女性或没有女性发生结局。这也将导致对治疗效果的偏倚估计(RR分别为3.10和0.60)。然而,不太可能有人会认为这种假设是合理的。
场景3呈现了一个更现实的情况,但可能更令人困惑。在这种情况下,我们假设每组中有25%的人缺失结局数据。乍一看,这样的发现会让大多数读者认为没有问题,因为两组的缺失是一样的。
然而,在治疗组中,缺失的是女性;而在安慰剂组中,缺失的是男性。
由于男性和女性的结局基线风险不同,因此治疗组和安慰剂组的结局风险(根据现有数据估计)将存在偏倚。观察到的治疗效果也会有偏倚(RR 1.12)。
尽管基线时两组的性别完全平衡,但在场景1和2中,仅包括分析中观察到结局的参与者会导致两组的性别不平衡。换句话说,即使进行了意向治疗分析,但由于预后变量(在本例中为性别)的不平衡(结局数据缺失),估计的疗效仍有偏倚。
2.在意向治疗分析中,什么时候结局数据缺失会导致效应估计的偏倚?
如果结局数据缺失,我们通常认为这些数据是选择性缺失,因为预后通常决定患者是否会对治疗(或安慰剂)产生反应或出现不良反应。
在表1的情景2和3中,结局数据的缺失与性别和治疗组相关。
如果结局数据的缺失在某种程度上直接或间接地与基线时的预后特征以及治疗组相关,这将在观察到结局的患者中造成基线预后的不平衡。请注意这种偏倚不一定是保守的,也不能通过意向治疗分析加以纠正。
非预后因素导致的结局数据缺失无关紧要(即这不会使疗效估计值发生偏倚)。
如果结局缺失取决于治疗状态,但与预后因素无关(例如治疗组随机50%的参与者失访),则这也不会使疗效估计值发生偏倚。
表1:随机试验中由于缺失结果导致的偏倚示例以及如何报告缺失结果的试验
如何报告?
美国国家研究委员会(National Research Council)的报告明确指出,研究者应描述患者失访的原因,以及结局缺失的原因(例如参与者离开,这可能意味着预后良好)。
我们想补充的是,为了使这一过程对读者透明,我们应该包括第二个表,该表显示了观察到结局的患者和被纳入分析的患者的基线特征在各治疗组中的分布。
通常的随机试验报告指南明确指出,应提供预后特征的“基线表”,以便读者在随机分组后立即判断治疗组之间的这些特征是否确实平衡。
这将意味着包括一个表,显示各治疗组中的女性百分比在基线时确实平衡(50%vs 50%)。
为了确定结局缺失导致的预后特征不平衡,作者还应提供“第二基线表”。
也就是比较实际纳入分析的研究组参与者(即观察到结局的参与者)之间的预后基线特征。
表2:关于如何分析和报告随机试验中缺失结局数据的指导
1.如何解读:
在表1所示的情景2中,第二个表将表明两组之间的女性百分比不再平衡(治疗:0%;安慰剂:50%)。
在情景3中,该表显示两组的女性比例不平衡(治疗组:33%;安慰剂:67%)。确定缺失数据导致潜在偏倚的常用方法是比较有缺失值和无缺失值的参与者。
2.如何分析:
在情景2中,这样的表格确实表明,在结局数据缺失和未缺失的患者之间,女性和治疗组参与者的百分比不平衡(在结局缺失的患者中,100%为女性,100%属于治疗组;在无结局缺失的患者中,33%为女性,33%在治疗组),这表明结局数据缺失可能导致偏倚。
然而,在情景3中,这个表格将显示女性的百分比(缺失:50%;未缺失:50%)和治疗组参与者(缺失:50%;不缺失:50%)在有和没有缺失结局的患者中是相等的。
因此,一个比较有缺失值和无缺失值的参与者的表格将错误地使研究者和读者相信,缺失结局不会潜在的导致偏倚,尽管它确实会导致偏倚。如果篇幅有限,在杂志网站上的副刊可能是报告建议的第二个基线表的合适地方。
关于需要报告的重要缺失数据的其他问题,包括在研究设计中为防止缺失数据做出了哪些努力、缺失数据的程度、在分析中如何处理缺失数据,以及明确说明缺失数据导致偏倚的潜在可能性。其他人也提出了这些问题。有缺失结局的试验的报告和分析指南见表2。感兴趣的读者可自行寻找一些参考文献,以获得关于这些主题的进一步信息。
如何分析
在医学研究中处理缺失数据的一种方法是填补(即填补)缺失值。填补缺失的基线协变量和缺失的结局值基本上无差异。然而,在对结局进行填补时,研究者可能会感到不舒服。
在随机试验中,由于结局的选择性缺失而导致的不平衡,处理这种不平衡的最直接方法是像在观察性研究中那样控制不平衡的预后特征。有人可能认为,在存在缺失结局的情况下,随机试验变成了观察性治疗性研究,而在观察性治疗研究中,由于混杂因素,治疗组的基线预后通常不同。
但是在观察性流行病学研究中,在分析中通常也对治疗组间预后特征的差异进行了校正(混杂因素校正)。这种方法的优点很明显,简单且熟悉。
此外,读者会立即清楚发生了什么:作者对预后不平衡进行了校正,预后不平衡不是由随机分组引起,而是在随机分组后发生的,很可能不是偶然。在表1中列出的所有情况下,针对性别进行校正(例如分层)确实会产生无偏倚的疗效估计值(RR 0.8)。
在美国国家研究委员会(National Research Council)的报告中,讨论了更复杂的统计学方法(多重填补和逆概率加权),以控制因结局数据缺失导致的偏倚。这些方法相较于简单调整更具理论上的优势:
因为它们不依赖于模型进行调整,而是在某种意义上“重建”了原始研究人群。
他们甚至可能使用观察到的随机分组后变量或次要结局来填补主要结局的缺失数据。
因此,在解决随机试验中因缺失结局导致的偏倚方面,多重填补和逆概率加权比传统校正方法更灵活。多重填补甚至可用于基线和结局数据均缺失的病例。
如果正确指定调整模型、多重填补模型和逆概率加权模型,并在每个模型中包含相同的变量,则在偏倚和精度方面都将得到相同的结果。
即使首选多重填补或逆概率加权,作为第一步,使用完整病例进行更简单的校正分析,评估缺失结局的影响仍然有用。
在这种情况下,应使用用于多重填补或逆概率加权的相同变量进行校正。
然而,无论选择何种方法,我们都应该意识到,即使在进行校正、多重填补或逆概率加权后,只有在观察到的预后变量可以解释其缺失的情况下,缺失结局的情况才会得到弥补。
这一点在国家研究委员会的报告中得到了明确的阐述,并导致报告的作者指出,所有这些分析解决方案应该只被视为敏感性分析的形式。如果缺失依赖于未观察到的预后变量或结局本身未观察到的值,则缺失结局仍可能导致偏倚。
然而,鉴于此类偏倚仅在随机分组后才出现,并且基线时可能存在合理的可比性,因此偏倚可能没有对相同治疗进行的观察性研究严重,并且此类偏倚可以通过基于已知预后基线特征的调整或填补在很大程度上得到纠正。
结论
随机试验的关键优势在于参与者的随机分配意味着治疗组在基线时的所有(观察到的和未观察到的)预后特征方面预期具有可比性。为了维持两组基线可比性的这一预期,随机试验常规按照意向治疗原则进行分析。
尽管采取了所有预防措施,但结局数据缺失仍不可避免地成为所有随机试验中的一个问题,而且如果结局数据缺失与预后特征和治疗相关,则仅对观察到结局的参与者进行数据分析可能会使预后变量失衡。
在这种情况下,随机化所争取的基线平衡将被扭曲,分析和推断实际上将接近观察性研究的分析和推断。
一个非常大的,甚至无限的样本量的试验是没有帮助的。
意向治疗分析也不会;相反,如果基线时确实没有失衡,它实际上可能会给人虚假的安慰。
本公众号回复“立春”即可获得“立春”临床统计学沙龙PPT,数据等资料 |
后记
由于最重要的已知预后特征通常是在试验中观察到的,因此研究人员可以通过比较各研究组的预后基线特征来轻松检查缺失结局是否导致偏倚,并将这种比较限制在有观察到结局的患者以及因此被纳入分析的患者中。
使用这一“第二个基线表”发现的任何预后特征的不平衡都可以在分析中进行控制,就像在观察性研究中所做的那样,或者使用多重填补或逆概率加权等更灵活的方法。
鉴于结局数据缺失在任何随机试验中都是不可避免的,研究者应做好应对这种情况的准备。试验方案中应预先设定处理缺失结局数据的应急计划,因为如果
发生缺失结局,标准意向性治疗分析可能存在偏倚。
本公众提供各种科研服务了!
一、课程培训 2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、nhanes、孟德尔随机化等10余门课。如果您有需求,不妨点击查看: 二、数据分析服务 浙江中医药大学郑老师团队接单各项医学研究数据分析的服务,提供高质量统计分析报告。有兴趣了解一下详情: |