

GraphPad Prism可谓数据分析表现的小能手,能文能武能统计能画图,那它做统计时如何施展拳脚的,这几天让我们由浅入深的来学习下。
习题
MCF-7细胞过表达MKL-1、STAT3,或MKL-1加上STAT3,检测N-cadherin的相对表达量,pCDNA3.1为对照。
请用合适的统计方法对下列模拟数据进行分析:

再给个示例图提示

本题示例图来源于文献PMID:28499590;Fig 1A
答案:单因素ANOVA
看结构这只有一个分组的维度,即细胞的处理方式不同,所以在Prism里数据录入的形式应该选择Column。但Prism的方向跟Excel不同,组别分列,样本(或重复测量值)分行,所以在Excel中复制数据后,到Prism里要用“Ctrl+Shift+T
”来粘贴,将数据转个
90º
。组名也是一样的做法。
接下来,多组数据之间的比较,首先想到单因素ANOVA;但要先做正态性检验,若不符合正态分布,则应采用非参数检验。
1) 正态性检验:
点工具栏上的Analyze之后,在弹窗中选择Column statistics,勾选上所有组别。

点OK之后的弹窗中,把高斯分布(即正态分布)下的三个检验方法都勾上。
简单理解一下这三种方法:当样本量大时,三种方法的结果大同小异;样本量小时,一般只有SW法能计算出结果。至于大小样本的界定,还有不少争议,如30、200、2000为界。没把握就先都选上再看咯。Prism推荐第一种,但第二、三种更常用,SPSS里就是提供后两种的结果。

说句题外话,Prism开发组似乎不太喜欢KS法,因为不灵敏,认为它只是个历史情怀。在新版使用说明中讲到:“早期版本我们曾提供KS法,现在还是把它放在这(为了保持一贯性),只是不再推荐。”毫不掩饰的一脸嫌弃.jpg,所以不造将来的版本是否会淘汰它。
本例中N=3,果然只有SW法能出结果,并且很直白地告诉你有没有通过(pass)正态性检验,这里是Yes,符合。
2) 单因素ANOVA
再点一下Analyze,在刚才Column statistics的上方就是one-way ANOVA。同样勾选所有组别。

接下来的弹窗,在第一个选项卡(实验设计)中,本例都是独立样本,所以选第一个,没有匹配。下边是否假设为高斯分布,刚才检验过了,选符合。
Tips:注意区别Prism中使用的两个很容易混淆的词组,replicate values和repeated (或matched、paired) measures。前者可以理解为独立样本,如本文每个实验都重复做至少3次,用分别制备的质粒和细胞,就属于replicate。如果同一份细胞检测处理前和处理后的蛋白表达,则属于时间上有匹配的样本,要选用repeated / matched / paired的相关算法,这个以后会说。

第二个选项卡多重检验,选择各组间如何比较,都跟对照组比还是各组都两两比较,还是跟哪个特定组比。本例就选全都两两比较。

但多组的两两比较会增加族错误率,所以要采取一些较正方法,通常用Bonferroni,也可以点开下拉框选择其他,比如Tukey、Sidak。下边控制假阳性率是Prism新增的方法,你也可以试试。

点OK之后,结果中包含好几个表,先看ANOVA总表。上边的summary中的p值表示这些组是否有统计学差异,但具体在哪组还不知道。
下边的Brown-Forsythe检验即方差齐性检验(若每组都N>5,则还有Barttlet检验)。方差齐也是应用单因素ANOVA的前提之一,不齐则仍需做非参数检验。在SPSS里是要主动勾选是否做方差齐性检验的(用Levene法),而Prism则默默地算好了。
最后一句仍是直白提示,各组标准差没有显著差异,所以是可以继续应用ANOVA的结果的。

所以接下来看下边的多重比较表:

哪组跟哪组比、有没有差异、P值、可以打几个星号之类的细节都有了。这就可以标在图上了。(你问为啥跟示例图不一样?跟你讲了这是模拟数据不是原文数据嘛~)
在图上打标注的方法也很简单,就用工具栏上的画图和文字工具就可以了。
思考题
MCF-7细胞用野生型(WT)和突变型(M)Vimentin promoter的荧光素酶质粒后,再分别进行和上题一样的过表达处理。
请用合适的统计方法对下列模拟数据进行分析:

示例图还是来自上边那篇文献,PMID:28499590;Fig 2B
答案明天公布

—
END—
欢迎大家关注解螺旋生信频道-挑圈联靠公号~



点下“在看”,多根头发