如何用计算机做样本抽样,抽样设计和样本抽选.doc

抽样设计和样本抽选

抽样设计和样本抽选

确定样本量2

计算样本量5

界定和选择用于计算样本量的核心指标6

使用样本量表格8

使用样本量计算公式10

使用变形的样本量公式13

确定初级抽样单元的个数和集群规模 — 举例说明13

确定使用什么样本15

使用现有样本 — 方案116

为新样本开发抽样框18

恰当的概率抽样设计和抽样框18

人口普查抽样框以及何时必需进行更新21

使用新样本和进行抽样设计22

标准细分区域的设计 — 方案224

改造的细分区域设计 — 方案326

简化的设计 — 不建议使用29

如何绘制地图、拆分区域和编制住户列表30

创建细分区域 — 抽样方案2和331

针对MICS4样本的其他主题35

估计变化和分组分析37

水和厕所指标38

加权和计算抽样误差39

样本加权39

计算抽样误差40

样本抽选的技术细节42

PPS抽样的过程 — 方案242

PPS抽样的过程 — 方案 344

国家案例46

黎巴嫩案例46

莫桑比克案例52

抽样设计和样本抽选

本章专业性较强,主要针对抽样人员,但同时也可供调查协调员和其他技术专家使用。本章内容将帮助您:

确定样本量

判断现有的样本是否可用,或者为新样本确定合适的抽样框

为新样本进行抽样设计

在以下方面有所认知:如果要求分地区的估计值以及水和厕所的估计值

有代表性,其中所涉及到的样本量、估计值可靠性和调查成本

进一步熟悉加权、估计和抽样误差

了解pps(与规模成比例)抽样和潜在分层

了解两个不同国家的抽样设计

多指标类集调查(MICS)是一个抽样调查,而不是对整个目标总体来采集数据。调查中会涉及到多种调查对象:住户、15-49岁妇女、5岁以下儿童,或其他年龄段的人群。但是,被访者通常是调查户中孩子的母亲或者看护人。需要注意的是,第四轮多指标类集调查(MICS4)是一个全国性调查,需要从全国所有住户中进行抽样,而不仅仅是抽取有低龄儿童或育龄妇女的住户。

确定样本量

样本量是样本设计中最重要的因素,因为相对于其他因素,它对调查精度、成本和调查时长的影响更大。样本量取决于可用的资金以及对精度的要求。而后者,也就是对精度的要求,还需要考虑到估计值是只需要具有全国代表性,还是也要有分地区代表性。并且,总的样本量也与样本区域(初级抽样单位PSU)的数量以及最终集群的规模有关。因此,虽然可以借助数学公式来计算样本量,但是在确定样本量时也需考虑上述各种因素。

获取帮助

虽然本章内容比较详尽,但是并不是将读者只定位于专门的抽样统计学家。样本设计中很多方面都可能需要从国家统计部门内部或是统计部门以外来获取帮助。这些方面可能包括:测算样本量、构造抽样框、对多个可选的样本设计方案进行评估、运用pps抽样方法、权数计算,以及估计抽样误差。无论如何,我们都强烈建议您在样本设计阶段能得到国家统计部门的建议。

在确定初级抽样单位(PSU)个数和集群规模时有两条一般性的经验规则:PSU个数越多越好,因为这样有助于提高地域代表性亦即覆盖面,也有助于提高可靠性;集群规模则是越小越好,这样估计值将更加可靠。

例子:

在一个全国性调查中,一个600个PSU、集群规模为10户的样本和一个400个PSU、集群规模为15户的样本虽然样本量都是6,000户,但是前者可以得到更为可靠的估计结果。并且,集群规模为10户优于集群规模为15户,因为集群规模越小,调查的可靠性越高。总之,在其他因素相同的前提下,我们应该尽量增加PSU个数,同时减少集群规模。

一般来说,抽取的PSU越多,调查效果越好。但是,PSU个数的确定在很大程度上会受制于成本考虑、以及是否需要估计值分地区具有代表性(估计值的分地区代表性将在后面的章节中介绍)。交通成本是一个重要因素。如果PSU之间相距较远,且同一个调查队需要从一个地方到另一个地方开展调查(假设不是在每个PSU都聘用当地访问员),那么减少PSU个数将会显著降低整体调查成本。相反地,如果调查要求估计值具有分地区代表性,则往往不得不增加而非减少PSU个数。

集群规模是在确定样本量时需要考虑的另一个因素。它的影响可以通过样本设计效应即deff来度量。

样本设计效应deff是在样本量相同的情况下,实际的分层集群调查样本(在此例中为第四轮多指标类集调查)的抽样方差和简单随机样本 的抽样方差的比值。比如,如果调查中某个指标的deff计算值为2.0,就说明当样本量相同时,该调查估计值的抽样方差是简单随机抽样的两倍。之所以说小集群比大集群更为可靠,是因为deff值会随着集群中住户数的增加而增加。

本章节末尾讲到样本量时,会给出几个确定PSU个数和集群规模的具体例子。

简单随机取样由于成本较高,通常不在第四轮多指标类集调查(MICS4)以及其他住户调查中采

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值