Statistics with R-Inferential statistics-Week 1-Foundations for inference - Sampling distributions

对于已知的总体,可以用一下命令得到分布情况

data(ames)
ggplot(data = ames, aes(x = area)) +
  geom_histogram(binwidth = 250)

然而在实际情况中,很少能得到一个总体的全部数据,通常利用样本来估计总体,一下是随机取样的命令,取样一个名字为samp1的,样本容量为50的样本。

samp1 <- ames %>%
  sample_n(size = 50)

得到样本的分布图,可以与总体的做对比

ggplot(data = samp1, aes(x = area)) +
  geom_histogram(binwidth = 250)

根据取样的样本,我们得到了样本均值,样本均值可以估计出总体均值,一般情况下,样本容量越大,估计的越准确

samp1 %>%
  summarise(x_bar = mean(area))

用rep_sample_n,我们可以得到15000个样本容量为50的样本,并且得到15000个样本均值,进而画出各个样本均值的分布图。

sample_means50 <- ames %>%
                    rep_sample_n(size = 50, reps = 15000, replace = TRUE) %>%
                    summarise(x_bar = mean(area))

ggplot(data = sample_means50, aes(x = x_bar)) +
  geom_histogram(binwidth = 20)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值