R语言 CHAR 06

本文详细介绍了统计分析中的假设检验方法,包括大样本和小样本的总体均值检验、独立及配对样本的均值差异检验、总体比例检验、方差检验以及非参数检验如正态性检验和K-S检验。通过具体R代码示例,阐述了如何进行假设检验并计算效应量,帮助读者深入理解统计推断过程。
摘要由CSDN通过智能技术生成

假设检验

  • 总体均值的检验
  • 一个总体均值的检验
  • 大样本的检验
z.test(table$PM2.5.,mu=81,sigma.x = sd(table$PM2.5.),alternative = "less",conf.level = 0.95)
  • 小样本的检验
t.test(table$厚度,mu=5)
  • 检验效应量
library(lsr)
cohensD(table$厚度,mu=5)
  • 两个总体均值之差的检验
  • 独立大样本
library(BSDA)
z.test(table$男生上网时间,table$女生上网时间,sigma.x = sd(table$男生上网时间),sigma.y = sd(table$女生上网时间),alternative = "two.sided")
  • 独立小样本
#假设方差相等
t.test(table$甲企业,table$乙企业,var.equal = TRUE)
#假设方差不相等
t.test(table$甲企业,table$乙企业,var.equal = FALSE)
  • 检验效应量
library(lsr)
cohensD(table$甲企业,table$乙企业)
  • 配对的检验
t.test(table$旧款,table$新款,paired = TRUE) 
  • 总体比例的检验
  • 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
  • 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
  • 总体方差的检验
  • 一个总体方差的检验
library(TeachingDemos)
sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
  • 两个总体方差比的检验
table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
var.test(table[,1],table[,2])
  • 检验效应量
library(lsr)
cohensD(table$旧款,table$新款,method = "paired")
  • 非参数检验
  • 正态性检验的图示法 (QQ图)
qqnorm(table$绝对误差,xlab="lilunfenweishu",ylab = "yangbenfenweishu")
qqline(table$绝对误差,col="lightblue",lwd=2)
  • Shapiro-Wilk正态性检验
shapiro.test(table$厚度)
  • K-S检验
ks.test(table$厚度,"pnorm",mean(table$厚度),sd(table$厚度))
  • 总体比例的检验
  • 一个总体比例的检验
> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
  • 两个总体比例之差的检验
> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
  • 总体方差的检验
  • 一个总体方差的检验
library(TeachingDemos)
sigma.test(table$填装量,sigmasq = 16,alternative = "greater")
  • 两个总体方差比的检验
table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
var.test(table[,1],table[,2])


一、假设检验的原理

参数检验:总体分布特征为正态分布
非参数检验:不依赖于总体分布特征

1.1 提出假设

假设:对总体的某种看法
假设检验H0:利用样本信息判断假设是否成立的统计方法(=)
原假设H1:希望推翻的假设
针对视角不同,会产生不同结果
备择假设:希望予以支持的假设
双侧检验、双尾检验:备择假设中含有不等号
左侧检验:备择假设中含有小于号
右侧检验:备择假设中含有小大号

1.2做出决策

两类错误于显著性水平

第一类错误α:原假设是正确的却拒绝了它
第二类错误β:原假设是错误的却没有拒绝它

减小α就会增大β

显著性水平:犯第一类错误的概率(第一类错误可控)

决策的依据

P值:犯第一类错误的概率
请添加图片描述

请添加图片描述
拒绝H0时,表示有足够的证据证明H0是错误的
不拒绝H0时,表示没有足够的证据证明H0是错误的

效应量

效应量:度量差异大小的统计量,描述了差异程度是大、中、小
请添加图片描述

二、总体均值的检验

2.1一个总体均值的检验

请添加图片描述

大样本的检验

请添加图片描述
请添加图片描述

> z.test(table$PM2.5.,mu=81,sigma.x = sd(table$PM2.5.),alternative = "less",conf.level = 0.95)

	One-sample z-Test

data:  table$PM2.5.
z = -1.1856, p-value = 0.1179
alternative hypothesis: true mean is less than 81
95 percent confidence interval:
       NA 81.56174
sample estimates:
mean of x 
    79.55 

请添加图片描述

小样本的检验

请添加图片描述
请添加图片描述

> t.test(table$厚度,mu=5)

	One Sample t-test

data:  table$厚度
t = -5.6273, df = 19, p-value = 1.998e-05
alternative hypothesis: true mean is not equal to 5
95 percent confidence interval:
 4.725612 4.874388
sample estimates:
mean of x 
      4.8 

请添加图片描述

# 检验效应量
> library(lsr)
> cohensD(table$厚度,mu=5)
[1] 1.258306

2.2两个总体均值之差的检验

独立大样本

请添加图片描述
请添加图片描述

> library(BSDA)
> z.test(table$男生上网时间,table$女生上网时间,sigma.x = sd(table$男生上网时间),sigma.y = sd(table$女生上网时间),alternative = "two.sided")

	Two-sample z-Test

data:  table$男生上网时间 and table$女生上网时间
z = 1.1188, p-value = 0.2632
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -0.1712448  0.6268003
sample estimates:
mean of x mean of y 
 3.058333  2.830556 

请添加图片描述

独立小样本

请添加图片描述
请添加图片描述

#假设方差相等
> t.test(table$甲企业,table$乙企业,var.equal = TRUE)

	Two Sample t-test

data:  table$甲企业 and table$乙企业
t = 3.4943, df = 38, p-value = 0.001225
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 135.24 507.76
sample estimates:
mean of x mean of y 
   8487.5    8166.0 


#假设方差不相等
> t.test(table$甲企业,table$乙企业,var.equal = FALSE)

	Welch Two Sample t-test

data:  table$甲企业 and table$乙企业
t = 3.4943, df = 33.683, p-value = 0.001353
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 134.4528 508.5472
sample estimates:
mean of x mean of y 
   8487.5    8166.0 

请添加图片描述

请添加图片描述

> library(lsr)
> cohensD(table$甲企业,table$乙企业)
[1] 1.104985

请添加图片描述

2.3 配对的检验

请添加图片描述
请添加图片描述

> t.test(table$旧款,table$新款,paired = TRUE)

	Paired t-test

data:  table$旧款 and table$新款
t = -2.7508, df = 9, p-value = 0.02245
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.3690538 -0.2309462
sample estimates:
mean of the differences 
                   -1.3 

请添加图片描述

> library(lsr)
> cohensD(table$旧款,table$新款,method = "paired")
[1] 0.8698945

请添加图片描述

三、总体比例的检验

请添加图片描述

3.1 一个总体比例的检验

请添加图片描述
请添加图片描述
请添加图片描述

> n<-2000
> p<-450/2000
> pi0<-0.25
> z<-(p-pi0)/sqrt(pi0*(1-pi0)/n)
> p_value<-1-pnorm(z)
> data.frame(z,p_value)
          z   p_value
1 -2.581989 0.9950884

请添加图片描述

3.2 两个总体比例之差的检验

请添加图片描述
请添加图片描述

> n1<-200
> n2<-200
> p1<-0.27
> p2<-0.35
> p<-(p1*n1+p2*n2)/(n1+n2)
> z<-(p1-p2)/sqrt(p*(1-p)*(1/n1+1/n2))
> p_value<-pnorm(z)
> data.frame(z,p_value)
          z    p_value
1 -1.729755 0.04183703

请添加图片描述
请添加图片描述
请添加图片描述
请添加图片描述

> n1<-300
> n2<-300
> p1<-33/300
> p2<-84/300
> d0<-0.08
> z<-((p1-p2)-d0)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2)
> p_value<-pnorm(z)
> data.frame(z,p_value)
         z     p_value
1 -7.91229 1.26348e-15

请添加图片描述

四、总体方差的检验

请添加图片描述

4.1 一个总体方差的检验

请添加图片描述
请添加图片描述

> library(TeachingDemos)
> sigma.test(table$填装量,sigmasq = 16,alternative = "greater")

	One sample Chi-squared test for variance

data:  table$填装量
X-squared = 2.9741, df = 9, p-value = 0.9653
alternative hypothesis: true variance is greater than 16
95 percent confidence interval:
 2.812522      Inf
sample estimates:
var of table$填装量 
           5.287222 

请添加图片描述

4.2 两个总体方差比的检验

请添加图片描述
请添加图片描述

> table<-read.csv("/Users/zhourui/Documents/example6_6.csv")
> var.test(table[,1],table[,2])

	F test to compare two variances

data:  table[, 1] and table[, 2]
F = 0.47273, num df = 19, denom df = 19, p-value = 0.111
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
 0.1871127 1.1943320
sample estimates:
ratio of variances 
         0.4727311 

请添加图片描述

五、非参数检验

5.1 总体分布的检验

正态性检验的图示法 (QQ图)

请添加图片描述

> table<-read.csv("/Users/zhourui/Documents/exercise6_1.csv")
> par(mai=c(0.6,0.6,0.2,0.2),cex=0.7)
> qqnorm(table$绝对误差,xlab="lilunfenweishu",ylab = "yangbenfenweishu")
> qqline(table$绝对误差,col="lightblue",lwd=2)

请添加图片描述

5.2 Shapiro-Wilk正态性检验

请添加图片描述
请添加图片描述

> shapiro.test(table$厚度)

	Shapiro-Wilk normality test

data:  table$厚度
W = 0.91377, p-value = 0.07522

请添加图片描述

5.3 K-S检验

请添加图片描述
请添加图片描述

> ks.test(table$厚度,"pnorm",mean(table$厚度),sd(table$厚度))

	One-sample Kolmogorov-Smirnov test

data:  table$厚度
D = 0.23538, p-value = 0.2178
alternative hypothesis: two-sided

请添加图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值