正确理解差异的“专业意义”与“统计学意义”
在临床研究的实际工作中,往往有很多人过分地在乎“差异有没有统计学意义”,而忽视了差异在专业上的意义。其实两者同等重要!不能在论文的写作中一味地追求统计学意义,而忽视专业意义,甚至有人在结果中直接说明差异的统计学意义,根本不报告差异的实际大小。这肯定是不合理的,因为只有给出差异的实际大小,读者才能对差异的实际意义做出专业上的判断。
本次我们将就这一问题展开讨论,以说明以下三个问题:1、差异的专业意义和统计学意义是完全不同的两个概念;2、差异的专业意义与统计学意义同等重要,专业上有意义不一定统计学上也有意义,反之亦然;3、论文写作中差异的正确表达,不可遗漏信息,也不可让读者产生歧义。
1、差异的专业意义与统计学意义
差异的专业意义是指我们发现的差异在基础医学/临床医学/生物学上的实际意义,即这一差别能够反映一定的实际问题,或者能够区别出两类不同的病人,或者是能够区别不同的病程阶段,如此等等。简单地说就是,这一差别在专业上有用,能够对我们产生一定的提示作用。可参阅本公众号第73期文章,关于最小临床意义(MCID)的发现。
差异的统计学意义是指差异不出现概率小于0.05,它是利用反证法的思想说差异不出现的概率是小概率事件,那么我们可以在统计学上认为差异出现,即有统计学差异。至于为什么选0.05,可参阅本号第23期文章,关于p值的争议。
理解完概念后我们就会发现:差异的专业是指在专业上的指导价值,而统计学意义是指从概率论的角度出发,差异不出现的几率有多大。两者截然不同,那么两者间又是什么关系呢?
2、差异的专业意义与统计学意义同等重要
有了差异的专业意义和统计学意义,就会出现四种情况:a、差异在两者上都有意义,b、差异只有专业意义,c、差异只有统计学意义,d、差异在两者上都没有意义。
a、差异在专业上和统计学上都有意义,这是一件皆大欢喜的事。在很大程度上说明了你发现的差异很有意义,不仅能够指导实际工作,而且在统计上是靠谱的。
b、差异只有专业意义,这很忧伤,考虑增加样本量再试试。如使用某降压药物治疗10名高血压患者,治疗前后的舒张压平均下降值为10 mmHg,该组患者血压下降值的标准差为20 mmHg,经过配对t检验我们可以发现(t=1.58, p>0.1),差异无统计学意义。但是本研究中很明显下降了10 mmHg,应该是挺有价值的。在这种情况下,我们就需要增加样本量来看一下,这一差异是否真的没有统计学意义。当我们把治疗人数提高到20人,其他数据不变的情况下,经检验(t=2.24, p<0.05),差异有统计学意义。
c、差异只有统计学意义,这就需要合理评价差异的专业意义,不可盲目下结论。同样是上面的例子,治疗人数为3000人,舒张压平均下降值为0.8 mmHg,标准差还为20 mmHg,经过配对t检验我们可以发现(t=2.19, p=0.028),差异有统计学意义。可是0.8 mmHg的差别,对降压的意义真的重要吗?可想而知是不重要的。
d、差异在两者上都没有意义。这种情况一般是没有意义的,但是也需要去深入考虑其原因,是真的没意义,还是研究设计上出现了问题。
3、论文写作中差异的正确表达
在论文的写作中,对于差异的描述我们需要注意两点:
(1)同时写出差异的实际大小和差异的统计学意义,并尽量从差异的实际大小出发解读差异在专业上的意义。如果差异有实际意义而无统计学意义,尝试计算把握度power,探索一下是否是由于样本量不足而导致的。如果差异有统计学意义而无实际意义,合理解释差异的实际价值,不可盲目报告这一差异。
(2)在差异有统计学意义的表达上,不可使用“有显著差别”或“有极显著差别”等字样。因为读者看到“有显著差别”,还以为是差别在数值本身上差很大呢(如血压差10 mmHg),其实想表达的是差别出现的概率与0.05或0.01的关系。所以统计学意义只能写成“差异有统计学意义(p<0.05)”,或者是“差异有高度统计学意义(p<0.01) ”。