《统计学》笔记:第2章 数据的搜集

概率抽样 probability sampling

概率抽样,也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会呗选入样本。概率抽样具有如下特点:

  1. 抽样时是按一定的概率以随机原则抽取样本,使每个单位都有一定的机会被抽中
  2. 每个单位被抽中的概率是已知的,或者是可以计算出来的
  3. 当用样本估计参数时,要考虑到每个样本单位被抽中的概率

入样概率 sampling probability

每个样本单位被抽中的概率。

抽样框 sampling frame

抽样框是指对选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。

简单随机抽样 simple random sampling

简单随机抽样就是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。【批:简单随机抽样对抽样框的要求非常高,在实际调查中往往很难实现】

分层抽样 stratified sampling

分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。将各层的样本结合起来,对总体的目标量进行估计。分层抽样具有如下优点:

  1. 保证样本中包含各种特征的抽样单位,样本结构与总体结构比较接近
  2. 为组织实施调查提供了便利
  3. 既可以估计总体参数,也可以估计各层的目标量

整群抽样 cluster sampling

将总体中若干个单位合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有单位全部实施调查,这样的抽样方法称为整群抽样。整群抽样具有如下特点:

  1. 简化编制抽样框的工作量
  2. 节省调查费用,方便调查的实施
  3. 因为同一群内的单位或多或少有些相似,精度交叉,抽样误差比较大

系统抽样 systematic sampling

将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法称为系统抽样。系统抽样具有如下特点:

  1. 如果有辅助信息将总体内的单位有组织地排列,可以有效地提高估计的精度
  2. 估计量方差的估计比较困难

多阶段抽样 multi-stage sampling

采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样。这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

二阶段抽样 two-stage sampling

初级抽样单位 PSUs (primary sampling unit)

最终抽样单位 final sampling unit

非概率抽样 non-probability sampling

非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样包括方便抽样、判断抽样、自愿样本、滚雪球抽样和配额抽样。

方便抽样 convenience sampling

调查过程中由调查员依据方便的原则,自行抽取样本。方便抽样具有如下特点:

  1. 方便粘稠样,调查的成本低
  2. 样本选择带有随意性,将调查结果推广到总体是没有任何意义的

判断抽样 judgement sampling

判断抽样是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样等方式。

重点抽样 importance sampling:重点抽样是从调查对象的全部单位中选择少数重点单位,对其实施调查。

典型抽样 typical sampling:典型抽样是从总体中选择若干个典型的单位进行深入的调研,目的是同构典型单位来描述或解释所研究问题的本质和规律。

代表抽样 representative sample:代表抽样是通过分析,选择具有代表性的单位作为样本,在某种程度上,也具有典型抽样的含义。

自愿样本 voluntary sampling

自愿样本值被调查者自愿参加,称为样本中的一份子,向调查人员提供有关信息。

滚雪球抽样 snowball sampling

滚雪球抽样往往用于对稀少群体的调查。在滚雪球抽样中,首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的研究对象,调查人员根据所提供的线索,进行此后的调查。这个过程持续下去,就会形成滚雪球效应。

配额抽样 quota sampling

配额抽样类似于概率抽样中的分层抽样,在市场调查中有广泛的应用。它是首先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。这种抽样方式操作比较简单,而且可以保证总体中不同类别的单位都能包括在所抽的样本中,使得样本的结构和总体的结构类似。【批:配额抽样仅能保证在配额变量上,样本的结构和总体的结构类似,但不能保证在其他变量上的结构也相似】

CATI = computer assisted telephone interview

计算机辅助电话调查(CATI)系统把计算机与电话访问连接起来,调查的问卷被输入计算机,调查员在计算机屏幕前操作,随机样本的抽选由计算机完成,由计算机进行自动拨号,调查员将调查结果输入计算机。【批:我也不知道现在业内是否还在使用这种方法进行调查】

实验组 experiment group

实验组是指随机抽选的实验对象的子集。在这个子集中,每个单位接受某种特别的处理。【批:这种特别的处理通常称为实验刺激;因此实验组与对照组的差异可以简单的描述为是否接受实验刺激】

对照组 control group

对照组中,每个单位不接受实验组成员所接受的某种特别的处理。

抽样误差 sampling error

抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。在概率抽样中,我们依据随机原则抽取样本,可能抽中由这样一些单位组成的样本,也可能抽中由另外一些单位组成的样本。根据不同的样本,可以得到不同的观测结果。

非抽样误差 non-sampling error

非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机性误差,只是存在于概率抽样中【批:抽样误差并不是仅存在于概率抽样中,任何抽样都会存在抽样误差;只是在非概率抽样中,因为不是按照随机抽样原则抽取的样本,因此抽样误差无法确定】;非抽样误差则不同,无论是概率抽样、非概率抽样,或者在全面调查中,都有可能产生非抽样误差。非抽样误差包括抽样框误差、回答误差、无回答误差、调查员误差、测量误差。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

长行

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值