作者:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据。
前言
方差分析(均数的显著性检验)
方差分析(Analysis of Variance,简称ANOVA),又称“变异系数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。
1.适用条件
方差分析数据必须满足3个条件即独立、正态,方差齐次性。
---------------------#正态性检验#---------------------
#Shapiro-Wilk检验用来检验数据是否符合正态分布,类似于线性回归的方法一样,是检验其于回归曲线的残差。
#该方法作者推荐在样本量很小的时候使用,比如N<20。但是也有作者推荐在大数据集上使用。该作者将这种修改
#后的方法运用在R语言的stats包中的shapiro.test函数中。该检验原假设为H0:数据集符合正态分布。
#R语言中的Shapiro-Wilk检验(W检验),shapiro.test(x)该函数只有一个参数即数据集x。x可以是数值型向量,允许存在NA
#但是非丢失数据需要在3-5000内。
##example##
#11个随机抽取的样本的体重(斤)数据为:148,154,158,160,161,162,166,170,182,195,236
k
shapiro.test(k)
Shapiro-Wilk normality test
data: k
W = 0.78881, p-value = 0.006704
##p=0.0067
---------------------#方差齐性检验#---------------------
#R中最常用的方差齐性检验(bartlett检验),bartlett.test()调用格式为bartlett.test()调用格式为
#bartlett.test(x,g...)其中,参数x是数据向量或列表(list);g是因子向量,如果x是列表则忽略g,当使用数据集时,也通过formula调用函数
##example##
#以multcomp包中的cholesterol数据集为例
library(multcomp)
head(cholesterol)
trt response
1 1time 3.8612
2 1time 10.3868
3 1time 5.9059
4 1time 3.0609
5 1time 7.7204
6 1time