差异显著性检验是我们在分析数据的时候应用最多的统计学方法。
我们经常要比较两组或多组数据是否具有显著差异,同时我们还会用差异显著性检验识别不同组样品中具有显著差异的变量。
这篇推文会分别介绍经常使用的差异显著性检验方法在R语言中的实现。
方法选择
差异显著性检验具有多种方法,分别针对不同的情况,我们要根据自身情况选择合适的方法进行分析。
⚠️以上方法均为比较不同组数据见均值的差异显著性。
正态分布检验
可以看出在进行差异显著性检验之前,最重要的一步就是要评估数据是否符合正态分布。
QQ图
我们可以使用QQ图的方法来评估数据是否符合或接近正态分布。
QQ图是由观测值与按正态分布的预期值做出来的散点图,散点图组成的回归线越接近于标准线,表示实际观测数据越接近正态分布。
QQ图使用qqnorm和qqline两个函数完成,其参数比较简单,基本不需要修改和调整。
"Normal Q-Q Plot",
各参数意义:
y为待分析数据;
ylim为y轴范围;
main为图像标题;
xlab和ylab为x和y轴标签;
plot.it是否要绘图;
datax是否数据值为x轴数据。
FALSE, distribution = qnorm,
各参数意义:
y为待分析数据;
datax是否数据值为x轴数据;
distribution定义数据的参考理论分布;
probs为两个数字的向量,代表可能性;
qtype定义用于计算的分位数的类型。
使用一组随机数据绘制一个QQ图的示例。
x 10)
qqnorm(x)
qqline(x)