#R语言 基础统计学之样本量计算
以下介绍基础统计学关于样本量计算的问题,主要解决实际问题中在已知一些统计特征下,计算所必要的样本量,共有三种方式:总体方差已知时,总体方差未知时 ,估计比例为P时的三种情况下的样本量。
总体方差σ已知
若已知总体X的均值为μ,方差为 σ 2 \sigma^2 σ2,可以依据基本公式:
n = ( Z 1 − α / 2 σ 2 E ) 2 n = (\frac{Z_{1-\alpha/2}\sigma^2}{E})^2 n=(EZ1−α/2σ2)2
计算得出。
通过R语言编写一个较为简单函数实现:
sample_size1 <- function(E,var,conf.leval) #E:最大允许误差,var:总体方差,conf.leval:置信水平
{
alpha = 1- conf.leval
((qnorm(1-alpha/2)*sqrt(var))/E)^2#函数qnorm():计算正态下的分位数值
}
简单例子:某小区30000户,调查人员将抽取合适样本调查用户一个月的平均收入,要求置信度为95%,最大允许误差为2,由历史经验表明家庭间收入的方差为600,则需要抽取多少户经行调查?
> sample_size1 (E = 2,var = 600,conf.leval = 0.95)
[1] 576.2188
总体方差未知时
若已知总体X的均值为μ,总体方差 σ 2 \sigma^2