R语言统计分析——t检验

参考资料:R语言实战【第2版】

        在研究中最常见的行为就是对两个组进行比较。本例中将使用MASS包中的UScrime数据集。

1、独立样本t检验

        一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。这里假设两组数据时独立的,且服从正态分布。检验的调用格式为:

        t.test(y~x,data)

其中的y是一个数值型变量,x是一个二分变量。调用格式也可以是:

        t.test(y1,y2)

其中的y1和y2为数值型向量(即各组的结果变量)。可选参数data的取值为一个包含了这些变量的矩阵或数据框。

        与其他多数统计软件不同的是,这里的t检验默认方差不相等,并使用Welsh修正自由度。我们可以添加一个参数var.equal=TRUE以假定方差相等,并使用合并方差估计。默认的备择假设是双侧的(即均值不想等,但大小的方向不确定)。我们可以添加一个参数alternative="less"或alternative="greater"来进行有方向的检验。

# 加载MASS包
library(MASS)
# 使用MASS包中UScrime数据集进行t检验
t.test(Prob~So,data=UScrime)
## 尝试t.test()函数的另一种格式
y1<-UScrime[UScrime$So==0,"Prob"]
y2<-UScrime[UScrime$So==1,"Prob"]
t.test(y1,y2,var.equal=TRUE)

        结论:没有足够的证据表明南方各州和非南方各州拥有相同监禁概率。

2、非独立样本t检验

        当两组的观测之间相关时,我们获得的是一个非独立组设计(dependent groups design)。前-后测量设计(pre-post design)或重复测量设计(repeated measures design)同样也会产生非独立的组。

        非独立样本的t检验假设组间的差异呈正态分布。非独立样本t检验的调用格式为:

        t.test(y1,y2,paired=TRUE)

其中,y1和y2为两个非独立组的数值向量。示例如下:

# 加载MASS包
library(MASS)
sapply(UScrime[c("U1","U2")],
       function(x){c(mean=mean(x),sd=sd(x))})
with(UScrime,
     t.test(U1,U2,paired=TRUE))

        本例结论:差异的均值足够大,可以拒绝年长和年轻粘性的平均失业率相同的假设。

3、多于两组的情况

        如果想在多于两个的组之间进行比较,该如何操作。如果能够假设数据是从正态分布总体中独立抽样而得的,那么我们可以使用方差分析(ANOVA)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值