R语言统计分析——t检验

最新推荐文章于 2024-09-12 11:05:36 发布

maizeman126

最新推荐文章于 2024-09-12 11:05:36 发布

阅读量669

点赞数 8

分类专栏： R语言统计分析文章标签： r语言 t检验成组数据t检验配对数据t检验

本文链接：https://blog.csdn.net/maizeman126/article/details/141141629

版权

R语言统计分析专栏收录该内容

61 篇文章 2 订阅

订阅专栏

参考资料：R语言实战【第2版】

在研究中最常见的行为就是对两个组进行比较。本例中将使用MASS包中的UScrime数据集。

1、独立样本t检验

一个针对两组的独立样本t检验可以用于检验两个总体的均值相等的假设。这里假设两组数据时独立的，且服从正态分布。检验的调用格式为：

t.test(y~x,data)

其中的y是一个数值型变量，x是一个二分变量。调用格式也可以是：

t.test(y1,y2)

其中的y1和y2为数值型向量（即各组的结果变量）。可选参数data的取值为一个包含了这些变量的矩阵或数据框。

与其他多数统计软件不同的是，这里的t检验默认方差不相等，并使用Welsh修正自由度。我们可以添加一个参数var.equal=TRUE以假定方差相等，并使用合并方差估计。默认的备择假设是双侧的（即均值不想等，但大小的方向不确定）。我们可以添加一个参数alternative="less"或alternative="greater"来进行有方向的检验。

# 加载MASS包
library(MASS)
# 使用MASS包中UScrime数据集进行t检验
t.test(Prob~So,data=UScrime)
## 尝试t.test()函数的另一种格式
y1<-UScrime[UScrime$So==0,"Prob"]
y2<-UScrime[UScrime$So==1,"Prob"]
t.test(y1,y2,var.equal=TRUE)

结论：没有足够的证据表明南方各州和非南方各州拥有相同监禁概率。

2、非独立样本t检验

当两组的观测之间相关时，我们获得的是一个非独立组设计（dependent groups design）。前-后测量设计（pre-post design）或重复测量设计（repeated measures design）同样也会产生非独立的组。

非独立样本的t检验假设组间的差异呈正态分布。非独立样本t检验的调用格式为：

t.test(y1,y2,paired=TRUE)

其中，y1和y2为两个非独立组的数值向量。示例如下：

# 加载MASS包
library(MASS)
sapply(UScrime[c("U1","U2")],
       function(x){c(mean=mean(x),sd=sd(x))})
with(UScrime,
     t.test(U1,U2,paired=TRUE))

本例结论：差异的均值足够大，可以拒绝年长和年轻粘性的平均失业率相同的假设。

3、多于两组的情况

如果想在多于两个的组之间进行比较，该如何操作。如果能够假设数据是从正态分布总体中独立抽样而得的，那么我们可以使用方差分析（ANOVA）。

maizeman126

关注

8
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录