R in a Nutsbell 18.统计检验

基于正态分布的检验

均值检验

**适用情况:**在数据服从正态分布的情况下,比较观测值的均值μ与零假设的均值μ0是否有差异。
函数介绍:

t.test(x,y,alternative,mu,paired,var.equal)
x:输入观测值向量。
y:如果比较向量的均值与零假设的均值时,设为NULL;或者比较x和y。
mu:指定零成立时的均值。
alternative:指定备则假设的类型,有双侧检验two.sided、左边检验less、右边检验greater。
paired:逻辑值,指定待检验对象是否为配对数据。
var.equal:逻辑值,指定待检验的两个向量的方差是否设为同一个值。

(1)比较轮胎H平均使用时间和9的比较
t.test(x = times.H,mu = 9)
(2)比较轮胎D和轮胎E的平均使用时间。
t.test(x = times.D,y = times.E)

可以用一个公式来设定t检验

t.test(formula = y~x,data)
y:所有输入的数据。
x:因子分类列。

(1)比较室内和室外平均得分
t.test(yard~outside,data = good)

配对数据的均值比较
paired = TRUE可以完成该操作。
配对数据是指某个项目有前后两次的观测值。

多个组间的均值比较
在服从正态分布前提下,对于两组以上数据间的均值的比较,需要使用方差分析(ANOVA)。
(1)最简单的函数是aov()

aov(formula = y~x,data)

想获取更详细的信息,可以把avo object传入model.tables()函数。

(2)第二种方法是先用lm()函数建立线性模型,在用anova()提取关于方差的分析信息*该函数假设各组样本的方差都是相等的 *。

fit = lm(age~Cause,data = mort06.smpl)
anova(fit)

多组样本的配对t检验

pairwise.t.test(x,g)
x:数值型向量,将要输入的所有的数据。
g:用于分组的因子变量。
方差检验

var.test
在数据服从正态分布的前提下,检验两总体的方差的差异是否具有统计显著性。

var.test(x,y,ratio = 1,alternative,coef.level = 0.95)
var.test(formula = y~x,data )

bartlett.test
检验每个组样本数据的方差是否一致。

bartlett.test(formula = y~x,data)
分布检验

正态性检验
(1)利用shapiro.test()函数检验一个分布是否为正态分布。

shapiro.test(x)
x:数值型向量

(2)绘制直方图

hist(x,breaks = 25)

(3)QQ图

qqnorm(x,pch = '.')

或者car包的中的qqPlot

分布的对称性检验
可以用KS检验来查看一个向量是否来自对称的概率分布。

ks.test(x,y,alternative,exact)
x:指定待检验数据。
y:指定对称分布类型,可以是数值型向量也可以是概率分布名称。
exact:指定是计算统计量的准确值还是近似值。

例子:利用ks.test函数进行正态性检验:ks.test(x,pnorm)
结果出现警告信息代表不服从正态分布。

检验两个向量是否服从同一个分布
ks检验可以用于计算两个向量出自同一分布的概率。
为了先出函数中关于函数打结的警告,利用jitter()函数加入一些抖动。

ks.test(jitter(x),jitter(y))

相关性检验
利用cor.test()函数来检验两个向量之间的相关系数是否显著。

cor.test(x,y,alternative,method,exact)
cor.test(formula,data)

不依赖分布的检验

均值检验

Wilcoxon检验依赖于变量x和y的不同样本值的秩。
wilcox.test()函数是不依赖分布假设的t检验。

wilcox.test(x,y,alternative,mu,paired)
多均值比较

kruskal-Wallis检验不依赖分布的ANOVA检验。

kruskal.test(x,g)
kruskal.test(formula = y~x,data)
方差检验

如果想用非参数检验来比较来自不同组别之间的方差,可用Fligner-Killeen中位数检验。

fliger.test(formula,data)

有关离散数据检验

比例检验

利用prob.test()函数来检验两组观测值成功发生的概率是否有显著差异。
零假设为所有组的比例都相等或比例等于给定值。

prob.test(x,n,alternative,p,conf.level = 0.95)
prob.test(table)

传入的table:列名为不同的组,行名为可能的结果。

二项式检验
binom.test(x,n,p = 0.5,alternative)
x:成功的次数。
n:试验的总次数
p:每次试验成功的概率。

例子:一个选手安打水平均为0.264(416击110中),假设他实际上是一个0.300击球手,那在他一系列打球的击球得分率<=0.264的概率是多少。
binom.test(x = 110,n = 416,p = 0.264,alternative = "less")

列联表检验

根据列联表中的数据确定两个分类变量之间是否相关。原假设为两个变量相互独立。
fisher.test
chisq.test
在函数中传入表格。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值