1. GraphPad Prism统计分析方法概述
GraphPad与其他软件(如SAS、SPSS等)不同的是,GraphPad在绘图的过程中可以同时完成一些相应的统计分析,方便用户操作使用。
单击工具栏中的Analyze (分析)图标按钮(图1),即可进入Analyze Data (数据分析)窗口(图2)。左侧一栏为GraphPad软件内置的11类统计分析方法,以及最后一个Recently used (最近使用)使用的方法。前11类统计分析方法中除了Transform, Normalize (转换,标准化)、Generate curve (生成曲线) 和Simulate data (模拟数据) 3类,其余8类统计分析方法与8种数据表相对应。此外,右侧一栏是要进行分析的数据集,勾选即可选中。
图1
图2
2. GraphPad Prism常见统计分析方法分类
2.1 Transform, Normalize (转换,标准化)
Transform, Normalize主要是进行数据的转换和标准化,使数据符合特定统计分析方法的适用条件。该类可进行统计分析的方法有7种(图3)
图3
2.1.1 Transform (转换)
Transform (转换):主要有4种转换方式(图4),分别是标准函数转换、药学和生物学转换、用户自定义的X值转换和Y值转换。标准函数转换包括X和Y值的位置互换,用户还可以自己选择X值和Y值转换的函数式。此外,对重复值的处理可以选择“转换单个Y值”或“平均值代替”的方法。转换后的数据(以对数转换为例),可在左侧Results (结果)部分查看(图5)。
图4
图5
Transform concentrations (X) (浓度转换):主要处理X值表示浓度的数据。
Normalize (标准化):对数据进行标准化,可设定0%值和100%值。
Prune rows (修剪行):设定行的范围,对该范围内的数据进行分析。
Remove baseline and column math (移除基线行和列):选择作为基线数据的行和列,然后用其他行列数据对基线数据进行相应计算。
Transpose X and Y (转置X和Y)
Fraction of total (局部占总体的比例)
2.2 XY analyses (XY表分析)
XY表展示的是X和Y两个变量的关系,即平行关系或潜在因果关系。平行关系一般会采用相关性分析,因果关系则常使用回归分析进行研究。XY表下常见的统计分析方法主要有10种(图6):
Simple linear regression:简单线性回归
Simple logistic regression:简单logistic回归
Nonlinear regression(curve fit):非线性回归(曲线拟合)
Fit spline/LOWESS:样条拟合/局部加权回归
Smooth, differentiate or integrate curve:平滑、微分或积分曲线
Area under curve:曲线下面积
Deming (modelⅡ) linear regression:戴明(模型2)线性回归
Row means with SD or SEM:带标准差或标准误的行平均值
Correlation:相关性分析
Interpolate a standard curve:从标准曲线解析插值
图6
2.3 Column analyses (纵列表分析)
纵列表也称作一维分组表,它的特征是只有一个分组变量,数据表中的每一列代表一个组别,且在行上没有分组。在纵列表中,每一列为相互独立或相关的数据,它可以展示每列数据的分布和统计量。
纵列表数据以列的形式为一个分组因素,根据分组后的样本数据特征,可选择下面10种常见的分析方法(图7):
T tests (and nonparametric tests):t检验(和非参数检验)
One-way ANOVA (and nonparametric or mixed):单因素方差分析(和非参数检验或混合模型)
One sample t and Wilcoxon test:单样本t检验和Wilcoxon秩和检验
Descriptive statistics:描述性统计
Frequency distribution:频数分布
Normality ang lognormality tests:正态性和对数正态性检验
ROC curve:ROC曲线
Bland-Altman method comparison:Bland-Altman一致性检验
Identity outliers:离群值识别
Analyze a stack of P values:P值分析
图7
2.4Grouped analyses (行列分组表分析)
行列分组表也称作二维分组表,即行和列都是分组因素(每一列定义一个组别,每一行定义一个组别)。常使用的统计分析方法有以下4种(图8):
Two-way ANOVA (or mixed model):两因素方差分析(或混合模型)
Three-way ANOVA (or mixed model):三因素方差分析(或混合模型)
Row statistics:带标准差或标准误的行均数统计分析
Multiple t tests (and nonparametric tests)-one per row:每行之间的多重t检验(和非参数检验)
图8
2.5Contingency analyses (列联表分析)
列联表将观察值按照两个变量或多个变量分类列出。列联表常用的统计分析方法有3种(图9):
Chi-square (and Fisher’s exact) test:卡方(和Fisher精确)检验
Row statistics:带标准差或标准误的行均数统计分析
Fraction of total:部分占总体的比例
图9
2.6Survival analyses (生存表分析)
生存表主要用于生存分析和绘制生存曲线,包括的统计分析方法为Survival curve(生存曲线),见图10。
GraphPad软件只提供单因素的Kaplan-Meier法、Logrank检验或Breslow检验,不提供寿命表法和Cox比例风险模型。
图10
2.7 Parts of whole analyses (局部整体表分析)
局部整体表常用的统计分析方法有2种(图11):
Fraction of total (部分占总体的比例):用来计算行、列和总数的百分比
Compare observed distribution with expected (比较观察分布和期望分布):用来推断两个总体率或构成比之间有无差别
图11
2.8Multiple variable analyses (多变量表分析)
多变量表的每一列代表一个变量,每一行代表一个个体或一次试验。它的数据结构与行列分组表类似,但多变量表不能设置子列。常用的统计分析方法有8种(图12):
Correlation matrix: 相关性矩阵
Multiple linear regression:多重线性回归
Multiple logistic regression:多因素Logistic回归
Principal Component Analysis:主成分分析
Exact and rearrange:数据提取与重排
Select and Transform:选择和替换
Descriptive statistics:描述性统计
Identity outliers:识别离群值
图12
2.9 Nested analyses (嵌套表分析)
嵌套表主要用于处理嵌套数据的统计分析和绘图。嵌套图常用的统计分析方法有6种(图13):
Nested t test:嵌套t检验
Nested one-way ANOVA:嵌套单因素方差分析
Descriptive statistics:子列描述性统计
Normality and Lognormality tests:子列正态性和对数正态性检验
Outlier tests:子列异常值检验
One-sample t test and Wilcoxon test:子列单样本t检验和Wilcoxon检验
图13
2.10 Generate curve (生存曲线)
根据软件自带的函数模型,用户可自行设置参数,点击OK按钮生成指定的曲线(图14)。
图14
2.11 Simulate data (模拟数据)
模拟数据主要用于熟悉软件的使用和统计分析方法,可以模拟XY数据表数据、纵列表数据、2×2列联表数据以及Monte Carlo(蒙特卡罗模拟),见图15。
图15