非劣效性等效性有效性临床试验

最新推荐文章于 2023-08-31 14:28:19 发布

m0_55809113

最新推荐文章于 2023-08-31 14:28:19 发布

阅读量6.3k

点赞数 6

分类专栏： statistics 文章标签：数据分析

原文链接：https://zhuanlan.zhihu.com/p/110074730

版权

statistics 专栏收录该内容

1 篇文章

订阅专栏

非劣效性试验是一种临床试验设计，旨在验证新药疗效不逊色于已知有效药物的一定范围内。通过设定非劣效界值，统计分析差值的置信区间来判断新药是否在可接受范围内。非劣效性试验对于新药研发具有重要意义，尤其当新药在其他方面（如安全性、便捷性）优于对照药物时，即使疗效稍弱也可能被接受。确定非劣效界值、阳性对照药的有效率、α值和ß值是设计试验的关键，这些因素会影响样本量和试验结论的可靠性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

非劣效是个什么鬼？

本文只是为了更好地理解临床试验中的优效性（superiority）、等效性（equivalence）以及非劣效性（non-inferiority），进一步了解可参阅：

（1）CCTS工作小组.非劣效临床试验的统计学考虑.中国药物评价,2012,29(4):262-269.

（2）黄钦,赵明.对临床试验统计学假设检验中非劣效、等效和优效性设计的认识.中国临床药理学杂志,2007,23(1):63-67.

临床研究中，在统计分析时我们最常用的就是差异显著性分析。比如想了解试验药物T与对照药物C的疗效是否相同，我们采用的就是差异性分析的假设检验法。进行检验时一般先假设T和C相等（没有差异），即T-C=0（但由于偶然因素，T-C之差不太可能刚好为0），然后我们在这个假设前提下，计算出由于偶然因素的原因才出现这个差值的概率（P值），最后再根据概率值的大小来决定是否拒绝T=C的假设【注：效应指标如为差值参照比较值是0，如果效应指标采用的是比值，参照值则为1】。显著性检验是把要分析的两组差值与0作比较，然而在实际的临床当中，有统计学意义未必有实际的专业意义，当考虑到实际临床意义时，我们可能会将两组差值与一个既定的值δ（即界值）比较，就产生了等效性（equivalence）检验、优效性（superiority）检验以及非劣效性（non-inferiority）检验。优效性试验的目的是为了显示试验药物优于对比药物（阳性或安慰剂对照）的设计。等效性试验是为了评价试验药物和阳性对照药物的疗效是否“相当”，多用于同一活性成分的药物间的比较。非劣效性试验旨在通过与阳性对照的比较，推断试验药物的临床疗效“不差于”已知阳性药物的疗效，从而评价试验药物的优效性和安全性。虽然可能试验药物比阳性对照药物疗效差，但其差值不大，在临床可接受的范围内。如果非劣效性检验成立，试验药物虽然比阳性对照药物在疗效上没有明显优势，但如果有其他方面的优势比如给药方便、价格价格便宜、不良反应少等，那么新药也是值得投入的。还需要说明的是，当我们以阳性药物作为对照时，实际上是默认了阳性对照的疗效是客观存在的而且是稳定的。

在这里插入图片描述

上图只为理解，不要形成以下这个错觉：非劣效/等效性界值和优效性界值必须是相等的，非劣效性、等效性、优效检验可以在一次试验设计实施后同时进行。实际绝非如此，任何试验都是设计在先，统计在后，界值的确定也必须是试验设计阶段，不能随意修改，否则就成了非劣效/等效/优效检验就成了数字游戏了。优效性试验中一般不会考虑非劣效界值，事后定制非劣效界值会增加偏倚导致Ⅰ类错误增加，所以优效性试验设计如果没有得出优效性的结论是不可以接着做非劣效检验的。但如果非劣效试验设计得出了非劣效结论，在某些情况是可以进行优效性检验的。

非劣效性、等效性、优效检验与传统的显著性检验最大的不同就是考虑了实际的临床意义，以有实际临床意义的差异δ进行假设检验。理论上，在优效性试验中，界值是指临床上认可的试验组临床疗效优于对照组时两组相差的最小值；而在等效性或非劣效试验中，界值是指临床上可以接受的试验组和对照组临床疗效相等时两组之差的最大值（药效间具有临床意义的最大允许差异值）。实际确认起来较为困难和复杂。注意此处的“临床疗效优于”和“临床疗效相等”指的是基于实际专业意义上的优于和相等，而不是只根据统计学意义。非劣效性、等效性、优效性试验的统计推断方法也有假设检验方法和置信区间法。

（1）假设检验方法
在这里插入图片描述

（2）置信区间法

该法就是构建差值的置信区间，通过置信区间的上下限与界值δ的关系来判定非劣效性、等效性和优效性。判断方法同传统显著性检验中的置信区间法，不同的是显著性检验是将差值与0作比较，依靠置信区间判断时是通过查看置信区间包不包含0来判断，而非劣效性、等效性、优效性检验是将差值与界值δ作比较，是通过查看置信区间包不包含界值来判断。
在这里插入图片描述
BMC Med Res Methodol. 2006;6:46-46.

补充说明：显著性检验中的假设检验与置信区间

差异显著性分析的假设检验方法只能推断两总体参数是否不等，利用确切的概率P值判断在统计学上有无统计学意义，要么有要么没有，不能推断差别的大小。在实际的临床当中，有统计学意义未必就有实际的专业意义。如某降压药治疗轻中度的原发性高血压，经治疗后发现其收缩压A比采用对照药物治疗的收缩压B低1mmHg（即A-B=1mmHg），只要两个治疗组的样本量足够，即使差值只有1mmHg，差异性检验的结果也会有统计学意义（P<0.05）,但这样一个1mmHg的差异临床上有多大的实际意义呢？【题外话：以上数据只为理解，实际FEVER研究显示，即使只有4/2mmHg的差异，单从血压上看可能没统计学差异，但主要终点事件如卒中、心血管事件的发生率差别还是很明显的】。根据实践经验或者啥啥标准，我们认为治疗组要比对照组至少降低5mmHg以上，这种差异才有实际的临床意义，这时候我们可以用置信区间进行统计推断。置信区间用于说明量的大小，即推断总体参数的范围。置信区间不仅仅可以回答假设检验的问题，即差别是否与统计学意义，如果置信区间包含了H0，则表示按照α水准尚不能拒绝H0，如果置信区间不含H0，则表示拒绝H0接受H1。另外置信区间还可以提示差别是否有实际的专业意义。
在这里插入图片描述

来源https://zhuanlan.zhihu.com/p/110074730

非劣效性检验，在新药临床试验中一般要求这种检验，这最先是ICH E9提出的，在2004年，中国国家药监局提出中国的临床试验统计指导原则，大部分是翻译的E9，也明确提出新药临床试验检验的类型非劣效、等效和优效。
非劣效性检验，由针对定量资料的和定性资料的，例如，对某新药疗效进行非劣效性检验，非劣效性界值为10%。这是针对定性资料，如治愈率等。若数据为各组样本均值、标准差，这是定量资料的描述。
要做出非劣效来，需要确定一个非劣效界值，不一定是10%，而是具体一个数据，然后计算两组均数之差的95%的可信区间，如果下限大于负的界值，就是非劣效了。
另外，非劣效、等效和优效思路和方法的提出对于新药研发具有划时代的意义，彻底颠覆了过去认为的两组统计学无差异，就说明等效的说法。

参考网络

统计检验：非劣效研究的统计检验是为了确认试验药的疗效在非劣效界值界定的拒绝域以内。在实际的运算上，往往是采用试验药与对照药疗效差值的区间来进行计算。通过公式或统计程序计算出差值的95%的置信区间，差值的置信区间位于拒绝域内即可。

下面列举一个具体的例子来说明这个问题。例如：研究数据显示试验药的疗效是88%，阳性对照药的疗效是89%。虽然试验药的疗效比对照药低1%，但从统计学的角度看，这种偏低可能是由于抽样误差导致的，事实上并不一定比对照药的低，所以进行统计检验。

假设预先确定的非劣效界值是10%。如果计算得到试验药-对照药差值的95%的置信区间是-5%到4%，那么这个范围是在-10%的非劣效界值界定的拒绝域以内，就可以得出非劣效的结论。如果计算得到差值的95%的置信区间是-15%到14%，那么差值的区间就在非劣效界值界定的拒绝域以外了，超出了拒绝域，说明试验药疗效不非劣于对照的的概率大于5%，也就不能排除他们相等，所以，在这种情况下，通过统计检验，不能确认试验药不劣于阳性对照药。

参考网络

什么是非劣效试验？

非劣效性试验（Non-inferiority Trial, NIT）也是一种随机对照临床试验（Randomized Clinical Trial, RCT），旨在确认试验药在疗效上要是比阳性对照差的话，也在可以接受的范围内，可以用非劣效界值界定这个范围。阳性对照药一般都是选用公认有效的标准治疗药品，其疗效和安全性已经得到了确认。

为什么要采用非劣效试验的设计？

一个新药要开展非劣效性研究，而非优效性研究的原因是认为新药的疗效不一定会优于现有的产品，而且也没有必要一定要优于现有的产品，因为试验药在其他方面具有优势。例如：安全性更好，使用更方便（例如某些长效制剂，静脉注射改为口服等），成本更低，有更好的稳定性等。同时，在已有公认有效的产品上市的情况下，使用安慰剂作为对照，也不符合伦理的要求。

非劣效试验的统计方法

1）样本量的计算：非劣效试验的样本量可以通过公式来计算，也可以用统计软件来计算，例如SAS、PASS等。样本量的大小与α值（显著性水平）、把握度、非劣效界值和阳性对照药物的有效率有关。某些申办方寄希望于采用非劣效试验减小样本量，从而减少临床研究的费用，这是不切实际的，除非假定试验药稍微优于阳性对照，这种假定是很危险的。样本量越小，试验失败的风险也越大。如果研究结束后不能得出非劣效的结论，意味着临床研究的失败，也就是前功尽弃了。

2）统计检验：非劣效研究的统计检验是为了确认试验药的疗效在非劣效界值界定的拒绝域以内。在实际的运算上，往往是采用试验药与对照药疗效差值的区间来进行计算。通过公式或统计程序计算出差值的95%的置信区间，差值的置信区间位于拒绝域内即可。

非劣效试验的结果有哪几种情况？

1）可能得到试验药优于对照药的结果。虽然最初的试验设计是按照非劣效试验设计的，但是在试验结束以后，如果试验药的疗效高于阳性对照药，而且直接将两个产品的疗效进行统计检验，得到的P值小于0.05，就可以认为试验药物的疗效高于阳性对照药了。一旦得出优效的结论，对产品的审批就非常有利。

作为一个新产品，总是可以找到除了疗效以外其他方面的优势的，这是现在非劣效试验设计比较多的原因。现在也有些新药的试验，一开始就采用优效性设计的方法，而不是非劣效的设计，说明新药的申办方对自己的产品非常有信心。而且一个优效性试验的结果，对产品上市后的市场开拓也是非常有利的。

2）得到试验药非劣于对照药的结果，这是试验设计的目标。如前所述，只要试验药和对照药疗效差值的95%置信区间在非劣效界值界定的拒绝域内，就可以得到试验药非劣于对照药的结论。此时试验药的疗效可能略高于对照药，或略低于对照药，或正好相等。但从临床医学学的角度看，这种差异是可以接受的，不会对临床治疗有实质性的影响。

3）得到试验药劣于阳性对照药的结果。虽然最初的试验设计是按照非劣效试验设计的，但是在试验结束以后，如果试验药的疗效低于阳性对照药，并且在进行统计检验以后，确认有统计学的差异，就可以认为试验药物的疗效低于阳性对照药。这种情况下，也有以下两种可能性：

a. 通过非劣效的检验，试验药疗效的下限超出了非劣效界值界定的拒绝域。这种情况下，不能得出试验药非劣于对照药的结论，而且能确认试验药的疗效劣于对照药。这种情况下，试验药的审批就很难通过了。

b. 通过非劣效的检验，试验药-对照药疗效差值的95%的置信区间落在非劣效界值界定的拒绝域内。这种情况下，非劣效检验可以得出试验药非劣于对照药的结论。但这种非劣效试验实际上也是劣效的结果，临床专家可能会认为这种劣效没有任何实质性临床意义。不管怎样，一旦出现了这样的情况，对新药的审批是不利的。

非劣效设计的临床研究需要注意的问题

非劣效界值的确定

虽然有统计学的方法来计算非劣效界值，但由于影响因素很多，既往的数据和参考的文献也不一样，对于非劣效界值的确定，很难找到一个标准答案。

统计学家认为，非劣效界值需要由临床专家来确定。但临床上的判断往往难以量化，所以临床专家往往会参考统计专家的意见。两方面的专家都尊重药审部门的意见，而药审部门也要参考专家的意见。

总的来讲，非劣效界值的确定，需要多个部门共同讨论来确定。非劣效界值与阳性对照的疗效差距越小，越能够说明试验药物非劣于阳性对照，但是需要的样本量越大，研究费用越高。非劣效界值太大，可能导致前文所说的情况，试验药的疗效劣于对照药，但是确是非劣效的。这种情况就依赖临床专家的判断了和审评人员的经验了。

阳性对照药的有效率的确定

研究开始前，阳性对照药的有效率是根据既往临床研究的结果和文献资料计算得到的。预估的对照药的有效率越高，需要的样本量相对越小。但在当前的临床研究中，由于入选和排除标准的不同，可能实际疗效与预估的疗效有差异。

一旦当前的研究中阳性对照的疗效低于预估的疗效，就可能出现把握度不足的问题，或者说，因为预估的样本量太低，经过统计检验无法得出非劣效的结论（P值大于0.05）。为了解决这个问题，可以采用中期分析的方法。

决决这个问题，有时通过中期分析，毕竟经过前期研究对试验药和阳性对照的差异有了一定的了解，应该相差不大。当前的研究中，采用盲态下样本量再估计。如果合并的有效率低于预设的阳性对照的有效率，需要增加样本量。

α值的确定

由于非劣效检验是单侧检验，所以a值一般需要定为0.025，双侧的a值为0.05。现在有的研究将单侧的a值定为0.05，这样双侧的a值就成为0.1了。这样做虽然可以使预估的样本量较小，但是这样的作法不一定能够得到药审部门的认可。

ß值的确定

ß值一般确定为0.1。有些研究中，将ß值确定为0.2，这样得话把握度（Power）就只有80%。虽然将ß定为0.2可以使预估的样本量较小，但是同时也增加了研究失败的风险，也就是说，由于样本量太小，研究无法得出非劣效的结论。现在药审部门也一般是要求将ß定为0.1。

分析人群

同优效性试验一样，一般采用意向性治疗原则进行统计分析，但同时也应该针对符合方案集进行分析。如果两者的结论一致，说明该研究具有良好的质量控制，结果可靠。如果两者得出的结论不一致，就应该进行进一步的讨论和分析。

总之，非劣效试验现在已经得到了广泛的应用，但非劣效试验中的一些具体问题，目前还没有确切的答案。需要各职能部门的沟通和协商，以及与药监部门的沟通和协商，共同解决问题。

来源网络选自：中国医学伦理学 2020年1月第33卷第1期 44-48

非劣效性 等效性 有效性临床试验

非劣效性等效性有效性临床试验