如何正确看待

        新英格兰医学杂志刊出的一篇综述《The Primary Outcome Is Positive — Is That Good Enough?》中[1],作者认为当临床试验的主要结局阳性时,还应当考虑11个问题。(表1)

                                                                     表1. 主要结局阳性时应当考虑的问题

我们将在医咖会微信公众号中分几期讨论这些问题,今天我们先讨论第1个。

一、“P<0.05认为差异有统计学意义”是什么意思?

在看文章、做研究、写文章的过程中,我们经常会看到这样的描述:P<0.05时,认为差异有统计学意义。实际上,这里的“0.05”是研究开始前指定的显著性水平α。那么,“P<0.05时,认为差异有统计学意义”或者“显著性水平α=0.05”到底是什么意思呢?

这里我们先简略解释两个概念。

1、零假设

以比较临床研究中治疗组和对照组用药效果的组间差异为例,判断是否有统计学意义所用的统计思维与中学数学的“反证法”思维类似,即:①假设两组没有差异,②统计检验现有数据,③发现根据现有数据,“假设两组没有差异”这件事情成立的可能性太低,④所以拒绝“假设两组没有差异”,认为“两组之间的差异有统计学意义”。这里的“假设两组没有差异”就是统计分析时的“零假设”。

2、Ⅰ类错误

然而,上述过程中,我们有可能犯错误:即如果“两组没有差异”这件事情是真实的,但是由于各种原因,我们根据现有数据得到的结果可能会发现“两组之间的差异有统计学意义”。这种错误可以类比为实验室检查中的“假阳性”,统计分析时称之为“Ⅰ类错误”,也就是零假设成立时我们错误地拒绝了零假设。

再来回顾前面的问题,大多数研究规定“P<0.05时,认为差异有统计学意义”或者“显著性水平α=0.05”,指的是如果本研究统计推断得到的差异有统计学意义,那么该结果是“假阳性”的概率小于0.05。显然,这个“假阳性”概率越小,我们由样本发现的治疗组和对照组的组间差异,越有可能反应总体的真实情况。

二、多次检验时,“假阳性”率还是0.05吗?

如果以显著性水平α=0.05为水准,对实际上成立的零假设进行n次检验,那么不出现“假阳性”的概率为(1- α)^n,至少出现一次“假阳性”的概率为1-(1- α)^n。n=10时,1-(1- 0.05)^10 =0.40,也就是说,干预措施本来没有差异,但10次假设检验中,至少有一次统计推断有差异(“假阳性”)的概率将达到40%,这么大的“假阳性”率让人难以接受。且随着n增大,1-(1- α)^n将更大。

规定显著性水平α=0.05时,我们可以认为P<0.05时,差异有统计学意义。但是一旦有研究遇到n次多重检验的问题,往往无法承受较高的“假阳性”率,因此会将显著性水平α调低。

三、并非任何情况下α都选取0.05

新英格兰医学杂志发表的一项3期药物临床试验——PARADIGM-HF[2],探讨某新药(代号LCZ696)相比依那普利,是否可以降低心衰患者的死亡和再住院风险时,将整个试验的显著性水平α设定为0.05,但在三次中期分析时,则将α分别定为0.0001、0.001和0.001。也就是说,在三次中期分析时,P值要小于0.0001、0.001和0.001,研究者才认为两组之间的效果差异有统计学意义。中期分析时将α值调低,目的就是降低多重检验时的“假阳性”率。

而另外一些研究,规定的显著性水平会高于0.05,尤其是一些探索性研究中,研究者试图发现创新性结果而暂时允许一定的“假阳性”风险。Lancet Oncol发表的一项2期药物临床试验[3],探讨厄洛替尼联合贝伐单抗是否可以成为EGFR突变的非小细胞肺癌患者新的一线用药时,就将显著性水平α定在了0.2。也就是说,在这个试验中,如果P<0.2,研究者就认为两组之间的差异有统计学意义。

可见,P<0.05并非判断研究结果是否有统计学意义的“万金油”。0.05只是一般情况下人为设定的显著性水平。

参考文献

1. N Engl J Med. 2016;375:971-9.

2. N Engl J Med. 2014;371:993-1004.

3. Lancet Oncol. 2014;15:1236-44.

阅读更多

正确看待培训

02-25

在网上看到很多的帖子。在讨论培训的话题。有好有坏。培训的存在一定有它存在的理由。下面我想讲一下我个人的观点。rn培训本身的问题:rn培训做为一种商品。那它一定有它适应的消费群体。也就有它的适用范围。培训一般分为高端和低端。高端培训是针对有一定基础想快速提高的用户。这些培训一般以认证为主。多数的培训内容是指对一种产品或一个过程的。如:.net、java、j2ee、dba、ccna、ccie等。这些培训多数是为了取得证书。同时也可以让你全面的了解对应的产品。这些培训是有一定的门槛的。而且效果也仅仅是对某些产品有一些认识罢了。用户往往对培训的期望过高。用户总想在培训后有一个数量级的提升。可以与从业多年的老手一比高下。商家也多不顾忌培训者的基础。给钱就行。管你是不是学的通。而且也是想方设法的作弊。骗取认证。这就使认证大大缩水。回头在看低端培训。这类产品是针对初学者的。如:北大青鸟、新东方职业、清华IT教育等。这些产品对IT理论进行了剪裁。培训目标也就是个入门。根本谈不到有多么的精深。对于生源大多缺少论理基础(指公共基础课)。这些群人在认识上有一定的理论缺陷。所以商家很难达到培训效果。其用户也就很难有好的市场。还有一些高低结合。所谓的中档培训也可归入这里。rn培训的供求关系:rn培训是一种商品。即是商品就是可以市场化的。就有供需矛盾。一方面是商家对自己的商品天花烂醉的宣传。一方面是学生如饥似渴的求知欲望。所以对在培训后的效果就有了一定的偏差。是商品就一定有质量问题。就不可能十全十美。只是培训这种商品有一定的抽象性。在认识上不容易界定。商家就有夸大产品功效的行为。学生因为没有能达到自己设定的目标。因此产生了二者的矛盾。这方面商家应该以人为本。诚信经营。多多考虑自己的教学能力和学生的接受能力。不要盲目招生。害己害人。学生也不要异想天开耽误自己的前程。rn培训的市场产生rn从我国目前的教育体制分析来看。我国的教育体制存在着很大漏洞。目前的现状是,高端的大学教育过盛。低端的劳动技能教育的缺失。同时IT业发展较为迅速。市场和学校教育也有一定的空隙。而我国的学校教育侧重于理论的学习。这就培养出的人才有一定的实践缺失。这些中间的空隙给了培训教育的发展空间。从目前的产业状况来看IT也的发展趋于平稳。不会有大起大落的形势。从发展来看低端的培训市场会越来越小。这部分的教育将以学校教育为主。在有就是市场对人才的要求会越来越专业化。所以想通过短期拔苗助长式的培训很难造就出合格的人才来。从学生的角度来看。想要超近道也不大行的通。没有良好的理论基础。在以后的发展中会非常的被动。选择这类培训一定要慎重。rn综合上诉分析。学生一定要根据自己的条件审时度势。不要对培训期望过高。培训只是给你一个较全面的认识性的提高。只是缩短了你的学习时间。不能代替你的经验积累。所以后期的学习是很重要的。商家也不要夸大产品功效。不顾客户的承受能力盲目推销。同时也应该努力提高培训质量。做到诚信经营。良性发展。

正确看待《Delphi高手突破》最后一章的实例 - 很久没提笔了。。。

08-01

《Delphi高手突破》已经出版近一年了,其间有不少读者发来Email,我没有做到每封必回,应该会得罪了不少读者朋友,在此只能说声抱歉了。不过,有不少读者来Email询问关于他们正在构建的系统的技术细节问题,也有读者发来源代码请求帮助的。希望这些读者能设身处地的为我考虑一下,我自己也在上班打工,也要构建老板要求的系统,我写的源代码也有很多问题需要修正,我也想找个人来帮我看看我的代码呀。rnrn  今天,我是想说一下,关于书的最后一章的那个文本编辑器的实例。呵呵,有读者认为设计的过于复杂了,其实我也这么认为。不过,我并不否定在最后一章插入这么一个“复杂设计”的实例。rnrn  首先,这是一本书。书的内容要求连贯,前后一致。这本书的内容其实都是围绕一个主题,就是“如何构建良好设计的代码”,前六章基本都是理论的描述以及很抽象的例子,比如:可乐管里放汽油,呵呵。没有一个实在的实例,读者看完全书都一定还是云里雾里,原先懂的就懂,原先不懂的,还是不懂。有了实例,读者至少对那些理论有一些“落实”的感觉。rnrn  其次,或许对于实际应用来说,这个实例的代码设计过于复杂了。要实现一个文本编辑器,其实不用那么麻烦,呵呵。这种应用,代码规模一般也就在一千到两千行左右,真的要换个编辑器组件,重写一个也不费事。不过,问题是,这个实例还是在书上的,也就是作为一个教具,它的作用不仅仅在于一个示范,而更在于能让读者留下“设计”的印象。因此,“设计”的痕迹就很重,矫枉必须过正。rn  另外,我认为,专业程序员的成长会分为三个阶段:rn  1、初级,特点:偏重实现,以能实现功能为荣,以此成就感作为前进的激励rn  2、中级,特点:随着代码量的积累,想重用以前写的东西,开始关注设计,崇拜设计,以自己的程序中使用了很炫的设计技巧为荣rn  3、高级,特点:从“崇拜”设计开始回归,能够轻易构建出较好设计的代码,但不会走火入魔,为设计而设计rn  《Delphi高手突破》名称虽然为“高手突破”,但其实并不是写给上述的高级或者中级程序员的(书名是出版社指定的,我也没法,不过你也可以把“高手突破”理解成“成长为高手的毕竟之路的突破点”)。而是写给那些还着重于实现功能的初级程序员的,至少,我是想指出一个提高的方向。rnrn  最后,就是书的篇幅有限,不可能做一个很庞大的应用来作为实例,至少在这本书里是不合适的。中国程序员还是穷的多,书写厚了,买的人少:)。我写这本书的初衷,也还只是希望能给像我曾经一样迷茫的程序员带来一些帮助,唤起某种意识就行了,真要深入学习、研究,一本书绝对不够的。如果你有了这样的意识,可以买大部头来看。rnrn  好久没写文章了,工作忙、人很累是原因,同时对于没有能够收到我的回信的读者,再次说声抱歉。rnrn2003-8-1 珠海rn出处:Nicrosoft个人网站 http://www.sunistudio.com/nicrosoft/

没有更多推荐了,返回首页