文章目录
![在这里插入图片描述](https://img-blog.csdnimg.cn/af13eca1dba148cf9d389de1e607f5cb.png#pic_center)
6.1 假设检验的原理
假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法。
6.1.1 提出假设
1、原假设:又称“0假设”,研究者想收集证据予以反对的假设,用H0表示。
- 总是有符号 “=”、“≥”、“≤”。
2、备择假设:也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示。
- 总是有符号“≠”、">”、“<”。
3、双侧检验与单侧检验
6.1.2 做出决策
1、第一类错误:原假设正确却拒绝。
2、第二类错误:原假设错误却接受。
3、显著性水平(P值):犯第一类错误的概率。
4、标准化检验统计量=(点估计量-假设值)/点估计量的标准误
5、用统计量决策
检验类型 | 决策依据 |
---|---|
双侧检验 | |统计量的值| > 临界值,拒绝H0 |
左侧检验 | 统计量的值 < —临界值,拒绝H0 |
右侧检验 | 统计量的值 > 临界值,拒绝H0 |
6、用P值决策:如果P < α,拒绝H0;如果P > α,不拒绝H0。
- 双侧Z检验统计决断规则
- 单侧Z检验统计决断规则
6.1.3 效应量分析
1、效应量:表示样本均值与假设的总体均值的差异是多少个标准差。
2、单样本t检验的效应量:|样本均值−假设的总体均值|/样本标准差
3、单样本t检验的小、中、大效应量对应的d值分别为0.20、0.50、0.80。
- 即d<0.20时,效应量非常小,几乎为0;
- 0.20≤d<0.50时,为小的效应量;
- 0.50≤d<0.80时,为中的效应量;
- d≥0.80时,为大的效应量。
6.2 总体均值的检验
6.2.1 一个总体均值的检验
1、大样本的检验
load("C:/example/ch6/example6_3.Rdata")
library(BSDA)
# z检验:大样本
z.test(example6_3$PM2.5值,mu=81,sigma.x=sd(example6_3$PM2.5值),alternative="less",conf.level=0.95)# 左尾检验
2、小样本的检验
example6_4<-read.csv("C:/example/ch6/example6_4.csv")
t.test(example6_4$厚度,mu=5)
# 计算效应量
library(lsr)
cohensD(example6_4$厚度,mu=5)
6.2.2 两个总体均值差的检验
1、两个独立大样本的检验
load("C:/example/ch6/example6_5.Rdata")
library(BSDA)
# z检验:独立大样本
z.test(example6_5$男生上网时间,example6_5$女生上网时间,mu=0,sigma.x=sd(example6_5$男生上网时间),sigma.y=sd(example6_5$女生上网时间),alternative="two.side",conf.level=0.95)
2、两个独立小样本的检验
load("C:/example/ch6/example6_6.Rdata")
# t检验:独立小样本,方差未知且相等
t.test(example6_6$甲企业,example$乙企业,var.equal=TRUE)
# t检验:独立小样本,方差未知且不等
t.test(example6_6$甲企业,example$乙企业,var.equal=FALSE)
# 计算效应量
library(lsr)
cohensD(example6_6$甲企业,example$乙企业)
3、两个配对样本的检验
load("C:/example/ch6/example6_7.Rdata")
# t检验:小样本,配对样本
t.test(example6_7$旧款饮料,example6_7$新款饮料,paired=TRUE)
# 计算效应量
library(lsr)
conhensD(example6_7$旧款饮料,example6_7$新款饮料,method="paired")
6.3 总体比例的检验
6.3.1 一个总体比例的检验
# 一个总体比例的右尾检验
n<-2000
p<450/2000
qi<-0.25
z<-(p-pi)/sqrt(pi*(1-pi)/n)
p_value<-1-pnorm(z)
6.3.2 两个总体比例之差的检验
# pi1-pi2=0
n1<-200
n2<-200
p1<-0.27
p2<-0.35
p<-(n1*p1+n2*p2)/n1+n2
z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
p_value<-norm(z) # 左尾检验
# pi1-pi2=0.08
n1<-300
n2<-300
p1<-33/300
p2<-84/300
d<-0.08
z<-((p1-p2)-d)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
p_value<-norm(z) # 左尾检验
6.4 正态性检验
1、QQ图
load("C:/example/ch6/example6_3.Rdata")
par(mfrow=c(1,2),mai=c(0.7,0.7,0.2,0.1),cex=0.8)
qqnorm(example6_3$PM2.5值,xlab="期望正态值",ylab="观测值",datax=TRUE,main="正态Q-Q图")
qqline(example6_3$PM2.5值,datax=TRUE,col="red")
2、Shapiro-Wilk检验(小样本)
example6_4<-read.csv("C:/example/chap06/example6_4.csv")
shapiro.test(example6_4$厚度)
3、K-S检验(大小样本)
read.csv("C:/example/chap06/example6_4.csv")
ks.test(example6_4$厚度,"pnorm",mean(example6_4$厚度),sd(example6_4$厚度))
假设检验方法小结
1、单个总体参数的假设检验
2、两个总体参数的假设检验