简单随机抽样
- 最基础的抽样方法
- 一次(非多层次、多阶段)抽样,或多阶段抽样的末端抽样(末端)总体的“要素”与抽样单位一致
简单随机抽样是抽样中最基本、最成熟、也是最简单的抽样设 计方式,是所有概率抽样方法发展、比较的基础。具体要求:
①熟练掌握简单随机抽样的抽样方式和样本抽选方法;
②熟知总体均值、总体总值和总体比例的简单估计;
③掌握样本量的确定;了解子总体的估计。
一.什么是简单随机抽样
定义:简单随机抽样(Simple Random Sampling, 简记为SRS)也称 纯随机抽样,对于大小为N的总体,抽取样本量为n的样本,若全部 可能的样本被抽中的概率都相等,则称这样的抽样为简单随机抽样.
分类:根据抽样单位是否放回可分为放回简单随机抽样和不放回简单随机抽样。
(一)放回简单随机抽样
定义:如果抽样是有放回的,每次抽取都是从
特点:(考虑与不考虑样本单位顺序)
共同点:同一个单位有可能在同一个样本中重复出现。
区别:(1)可能的样本数不同;(2)样本的概率分布不同,由此导致估计量的概率分布不同
(二)不放回简单随机抽样
定义:如果抽样是无放回的,即同一个单位不能在样本中重复出现,若考虑样本单位的顺序,则可能的样本为
若不考虑样本单位的顺序,则可能的样本为
共同点:(考虑与不考虑样本单位顺序)虽然可能的样本数不同,考虑顺序是不考虑顺序的n!倍,但是它们的样本有相同的概率分布。由此导致依据样本构造的估计量的概率分布也相同。
由于这一共同点的存在,加之不考虑顺序的放回简单随机抽样的工作量更小,所以抽样实践中对于不放回简单随机抽样,只讨论和使用不考虑顺序不放回简单随机抽样。
(三)放回与不放回简单随机抽样的比较
两者的主要不同之处:
- (1)每次抽取样本单位面对的总体结构不同。这一点使得前者 的数学处理相对简单。
- (2)样本提供的信息量不同。显然,在样本量一定的条件下, 由于后者提供的信息量大于前者,其抽样效率更高。
在实践中,一般多采用不考虑顺序的不放回简单随机抽样,所以 以下讨论如无特别说明,都指这一类简单随机抽样。
二、简单随机样本的抽选方法
简单随机样本的抽选,首先要将总体N个单位从1到N编号,每个单位对应一个号;然后从所编的号中抽号,如果抽到某个号,则对应的那个单位入样,直到抽够n个单位为止。
简单随机样本的抽选,通常有抽签法、随机数法。
(一)抽签法
当总体容量不大时,可分别采用两种方法抽取:
(1)全样本抽选法:即从N个签中一次抽取n个;
(2)逐个抽选法:即一次抽取一个签但不放回,接着抽下一个签, 直到抽够n个签为止。
可以证明,按这两种方法抽到的n个单位的样本是等价的,每个样 本被抽到的样本的概率都等于
(二)随机数法
当总体容量较大时,抽签法实施起来比较困难,这时可以 利用随机数表、随机数骰子、摇奖机、计算机产生的伪随机数 进行抽样。
1、利用随机数表抽样
随机数表是一张由0,1,2,…,9这十个数字组成的,一 般常用的是五位数的随机数字表,10个数字在表中出现的顺序 是随机的,每个数字都有同样的机会被抽中。
用随机数表抽选简单随机样本时,一般可根据总体容量N 的位数决定在随机数表中随机抽取几列。 比如N=768,要从中抽取N=10的简单随机样本,则在随机 数表中随机抽取相邻的3列,顺序往下(或往上),选出前10个 001到768之间的互不相同的数,如果这3列随机数字不够,可另 选其他3列继续,直到抽够个n单位为止。
用此种方法,当N的最高位数较小,比如小于5,且n不小时,由 读到的随机数被舍弃不用的比例较大,抽选效率较差。例如N=247, 此时采用下面的方法。
在随机数表中随机抽取3列,顺序往下,如果得到的随机数大于 247,小于989(因为247的4倍为988,因此000及989到999的数字应舍弃),则用这个数除以247,得到的余数入样,显然这种方法效率要高得多。随机数表的起始页和起始点都应用随机数产生。
2、利用随机数骰子抽样
3、利用摇奖机抽样
4、利用计算机产生的伪随机数抽样
大多数统计软件都有现成的产生随机数的程序。利用计算机产生 的随机数具有快捷、方便的特点。但通常产生的伪随机数有循环周期。 因此在有条件的情况下,一般不建议使用此种方法。
三、简单随机抽样在抽样理论中的地位与局限性
1,简单随机抽样在抽样理论中的地位
简单随机抽样在抽样理论中占有重要的地位,其他抽样方法都是在它的基础上发展起来的。它是抽样中最容易掌握的技术,也是发展最成熟的技术,建立了最完备的理论。简单随机抽样也是比较其他抽样设计方法优劣的基础。
2,简单随机抽样局限性
简单随机抽样也有许多局限性,其他抽样方法都是在它的基础 上,针对它的局限性发展起来的。当总体单位数N很大时,编制抽样框困难;抽样框中即使有辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的抽样设计方法低;由于样本在总体中的地理分布范围较广,如果采取