R语言 t分布的推导 初级统计学 学生t分布理论

t分布的推导

那我们来写写代码,实践这个过程。我设定一个总体均数为0,标准差=1,样本量为1000的人群(图A是这个总体的概率分布)。图B,也是一次抽取三个人,抽了200个,图C一次抽取6个人。都分别计算t值。我们看到图C,一次抽取6个人,分布更多集中在总体均数为0。 还有一个,问题,图B中画绿框的这一部分,怎么解释呢?课后可以想想。(1.抽样误差、2.开端的,无闭合)

在这里插入图片描述

继续写代码实践,。如一次,,,他们分布会有什么特点。从图片可以得出什么规律:发现一次抽取3次和一次抽取6次比。一次抽取3次的曲线更低,向两边散。一次抽取6个样的,更集中。

在这里插入图片描述

#生成正态分布的数值,1000,总体均数为0,标准差为1
data <- rnorm(1000, mean = 0, sd = 1)
#查看直方图分布
hist(data)
hist(data,freq = FALSE,,ylim=c(0,0.5))
lines(density(data),col="blue",lwd=2)

#如果抽取例数n=3的样本k个,假设抽取200个
data_n3_k200 = matrix(NA, nrow = 200, ncol = 3)
for (i in 1:200) {
  data_n3_k200[i, ] = sample(data, size = 3)
}
data_n3_k200 <- as.data.frame(data_n3_k200)
data_n3_k200$mean <- apply(data_n3_k200[1:200,1:3],1,mean)
data_n3_k200$sd <- apply(data_n3_k200[1:200,1:3],1,sd)
data_n3_k200$t <- (data_n3_k200$mean-0)/(data_n3_k200$sd/sqrt(2))
hist(data_n3_k200$t,freq = FALSE,ylim=c(0,0.6),xlim=c(-6,6))
lines(density(data_n3_k200$t),col="blue",lwd=2)


#如果抽取例数n=6的样本k个,假设抽取200个
data_n2_k200 = matrix(NA, nrow = 200, ncol = 6)
for (i in 1:200) {
  data_n2_k200[i, ] = sample(data, size = 6)
}
data_n2_k200 <- as.data.frame(data_n2_k200)
data_n2_k200$mean <- apply(data_n2_k200[1:200,1:6],1,mean)
data_n2_k200$sd <- apply(data_n2_k200[1:200,1:6],1,sd)
data_n2_k200$t <- (data_n2_k200$mean-0)/(data_n2_k200$sd/sqrt(2))
hist(data_n2_k200$t,freq = FALSE,ylim=c(0,0.9))
lines(density(data_n2_k200$t),col="blue",lwd=2)


#如果抽取例数n=3的样本k个,假设抽取10000次
data_n3_k10000 = matrix(NA, nrow = 10000, ncol = 3)
for (i in 1:10000) {
  data_n3_k10000[i, ] = sample(data, size = 3)
}
data_n3_k10000 <- as.data.frame(data_n3_k10000)
data_n3_k10000$mean <- apply(data_n3_k10000[1:10000,1:3],1,mean)
data_n3_k10000$sd <- apply(data_n3_k10000[1:10000,1:3],1,sd)
data_n3_k10000$t <- (data_n3_k10000$mean-0)/(data_n3_k10000$sd/sqrt(2))
hist(data_n3_k10000$t,freq = FALSE,ylim=c(0,0.5))
lines(density(data_n3_k10000$t),col="blue",lwd=2)zz


#如果抽取例数n=6的样本k个,假设抽取1000次
data_n2_k10000 = matrix(NA, nrow = 10000, ncol = 6)
for (i in 1:10000) {
  data_n2_k10000[i, ] = sample(data, size = 6)
}
data_n2_k10000 <- as.data.frame(data_n2_k10000)
data_n2_k10000$mean <- apply(data_n2_k10000[1:10000,1:6],1,mean)
data_n2_k10000$sd <- apply(data_n2_k10000[1:10000,1:6],1,sd)
data_n2_k10000$t <- (data_n2_k10000$mean-0)/(data_n2_k10000$sd/sqrt(2))
hist(data_n2_k10000$t,freq = FALSE,ylim=c(0,0.8))
lines(density(data_n2_k10000$t),col="blue",lwd=2)z
#hist(data_n3_k10000$t,freq = FALSE,ylim=c(0,0.5),xlim = c(-20,20))
plot(0,0.5,xlim=c(-1.5,1.5),ylim=c(0,0.7))
lines(density(data_n3_k10000$t),col="BLUE",lwd=2)
par(new=TRUE)
#hist(data_n2_k10000$t,freq = FALSE,axes = FALSE,xlab = "", ylab = "")
lines(density(data_n2_k10000$t),col="red",lwd=2)
  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值