《统计学基于R》：第六章假设检验

努力不秃头的小仙主

已于 2022-06-15 20:46:16 修改

阅读量1.2k

点赞数 2

分类专栏： R语言文章标签：概率论 r语言数据分析数据挖掘机器学习

于 2022-06-15 20:43:15 首次发布

本文链接：https://blog.csdn.net/xiaoxianzhu/article/details/125304379

版权

R语言专栏收录该内容

8 篇文章 8 订阅

订阅专栏

文章目录

6.1 假设检验的原理

假设检验：先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的统计方法。

6.1.1 提出假设

1、原假设：又称“0假设”，研究者想收集证据予以反对的假设，用H0表示。

总是有符号 “=”、“≥”、“≤”。

2、备择假设：也称“研究假设”，研究者想收集证据予以支持的假设，用H1或Ha表示。

总是有符号“≠”、">”、“<”。

3、双侧检验与单侧检验
在这里插入图片描述

6.1.2 做出决策

1、第一类错误：原假设正确却拒绝。

2、第二类错误：原假设错误却接受。

3、显著性水平（P值）：犯第一类错误的概率。

4、标准化检验统计量=(点估计量-假设值)/点估计量的标准误

5、用统计量决策

检验类型	决策依据
双侧检验	\|统计量的值\| > 临界值，拒绝H0
左侧检验	统计量的值 < —临界值，拒绝H0
右侧检验	统计量的值 > 临界值，拒绝H0

6、用P值决策：如果P < α，拒绝H0；如果P > α，不拒绝H0。

双侧Z检验统计决断规则
单侧Z检验统计决断规则

6.1.3 效应量分析

1、效应量：表示样本均值与假设的总体均值的差异是多少个标准差。

2、单样本t检验的效应量：|样本均值−假设的总体均值|/样本标准差

3、单样本t检验的小、中、大效应量对应的d值分别为0.20、0.50、0.80。

即d<0.20时，效应量非常小，几乎为0；
0.20≤d<0.50时，为小的效应量；
0.50≤d<0.80时，为中的效应量；
d≥0.80时，为大的效应量。

6.2 总体均值的检验

6.2.1 一个总体均值的检验

1、大样本的检验

load("C:/example/ch6/example6_3.Rdata")
library(BSDA)
# z检验：大样本
z.test(example6_3$PM2.5值,mu=81,sigma.x=sd(example6_3$PM2.5值),alternative="less",conf.level=0.95)# 左尾检验

2、小样本的检验

example6_4<-read.csv("C:/example/ch6/example6_4.csv")
t.test(example6_4$厚度,mu=5)
# 计算效应量
library(lsr)
cohensD(example6_4$厚度,mu=5)

6.2.2 两个总体均值差的检验

1、两个独立大样本的检验

load("C:/example/ch6/example6_5.Rdata")
library(BSDA)
# z检验：独立大样本
z.test(example6_5$男生上网时间,example6_5$女生上网时间,mu=0,sigma.x=sd(example6_5$男生上网时间),sigma.y=sd(example6_5$女生上网时间),alternative="two.side",conf.level=0.95)

2、两个独立小样本的检验

load("C:/example/ch6/example6_6.Rdata")
# t检验：独立小样本，方差未知且相等
t.test(example6_6$甲企业,example$乙企业,var.equal=TRUE)
# t检验：独立小样本，方差未知且不等
t.test(example6_6$甲企业,example$乙企业,var.equal=FALSE)
# 计算效应量
library(lsr)
cohensD(example6_6$甲企业,example$乙企业)

3、两个配对样本的检验

load("C:/example/ch6/example6_7.Rdata")
# t检验：小样本，配对样本
t.test(example6_7$旧款饮料,example6_7$新款饮料,paired=TRUE)
# 计算效应量
library(lsr)
conhensD(example6_7$旧款饮料,example6_7$新款饮料,method="paired")

6.3 总体比例的检验

6.3.1 一个总体比例的检验

# 一个总体比例的右尾检验
n<-2000
p<450/2000
qi<-0.25
z<-(p-pi)/sqrt(pi*(1-pi)/n)
p_value<-1-pnorm(z)

6.3.2 两个总体比例之差的检验

# pi1-pi2=0
n1<-200
n2<-200
p1<-0.27
p2<-0.35
p<-(n1*p1+n2*p2)/n1+n2
z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
p_value<-norm(z) # 左尾检验

# pi1-pi2=0.08
n1<-300
n2<-300
p1<-33/300
p2<-84/300
d<-0.08
z<-((p1-p2)-d)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
p_value<-norm(z) # 左尾检验

6.4 正态性检验

1、QQ图

load("C:/example/ch6/example6_3.Rdata")
par(mfrow=c(1,2),mai=c(0.7,0.7,0.2,0.1),cex=0.8)
qqnorm(example6_3$PM2.5值,xlab="期望正态值",ylab="观测值",datax=TRUE,main="正态Q-Q图")
qqline(example6_3$PM2.5值,datax=TRUE,col="red")

2、Shapiro-Wilk检验（小样本）

example6_4<-read.csv("C:/example/chap06/example6_4.csv")
shapiro.test(example6_4$厚度)

3、K-S检验（大小样本）

read.csv("C:/example/chap06/example6_4.csv")
ks.test(example6_4$厚度,"pnorm",mean(example6_4$厚度),sd(example6_4$厚度))

假设检验方法小结

1、单个总体参数的假设检验
在这里插入图片描述
2、两个总体参数的假设检验

努力不秃头的小仙主

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
《统计学基于R》：第六章假设检验

假设检验：先对总体的参数(或分布形式)提出某种假设，然后利用样本信息判断假设是否成立的统计方法。1、原假设：又称“0假设”，研究者想收集证据予以反对的假设，用H0表示。2、备择假设：也称“研究假设”，研究者想收集证据予以支持的假设，用H1或Ha表示。3、双侧检验与单侧检验1、第一类错误：原假设正确却拒绝。2、第二类错误：原假设错误却接受。3、显著性水平（P值）：犯第一类错误的概率。4、标准化检验统计量=(点估计量-假设值)/点估计量的标准误5、用统计量决策6、用P值决策：如果P < α，拒绝H0；如果P
复制链接

扫一扫