统计学(3)——数据抽样方法的细节

抽样

  • 数据的收集和整理
  • 收集数据时的误差
  • 常用的抽样方法
  • 设计调查问卷的原则

第一节:数据的收集和整理

全面调查与抽样调查是数据收集过程中最常用的2种方法。

1.全面调查:就是对调查对象逐个排查。

                     优点:得到的数据全面,可靠

                     缺点:耗费人力物力财力;调查时间长

                     适用范围:范围比较小;容易掌控;不具有破坏性;可操作性强

2.抽样调查:是从总体中,抽取若干个体(即样本)进行调查

                     优点:耗费的人力物力财力少;大量节约调查时间

                     缺点:需要具有足够代表性的样本;具有不稳定性,容易有所偏差

                     适用范围:范围广,工作量大

3.总体,个体,样本

总体:在统计学中,我们把所要考察的对象的全体称为总体。

个体:其中的每个考察对象称为个体。

样本:研究中实际观测或需要抽样调查出来的那一部分个体称为样本。

样本容量:样本中包含的个体的数量

4.简单随机抽样:在抽取样本时,如果总体中的每一个体都有同等机会被抽选到样本中,这种抽样称为简单随机抽样。这样得到的样本称为随机样本。

5.总体和样本的关系:如果总体是一碗八宝粥,随机样本则是充分搅拌后,八宝粥中的任意一勺。且搅拌越充分,样本的代表性越好。

选取样本的注意事项:样本的选取直接影响分析结果。

一般情况下样本容易出现的问题:(1)抽取的样本量过少;【样本与误差的关系:数据抽取的样本量越大,抽样误差越小,尤其是在样本分布不均时,样本量过少会导致结果的可信度更低】

                                                      (2)选取的样本主体不均匀

                                                      (3)样本抽取的客观环境不一致

第二节:收集数据时的误差

1.抽样误差

如果总体是一碗八宝粥,随机样本则是充分搅拌后,八宝粥中的任意一勺。且搅拌越充分,样本的代表性越好。然而,一勺八宝粥中的成分比例和整碗不一定相同,可能稍微多些或稍微少些。这是很正常的,这种差异不是错误,而是必然 会出现的抽样误差。抽样误差是由于抽样方法所导致的系统误差,在抽样中不可避免。

2.未响应误差:

在抽样调查中,人们因为种种原因没有对调查做出反应,这种误差称为未相应误差。

3.响应误差:

在抽样调查中,一些人因为各种原因,并没有真实反映他们的观点,称为响应误差。

和抽样误差不一样,响应误差和未响应误差是由于主观因素导致的,他们都会影响对真实世界的了解。我们在设计调查方案和进行调查过程中要尽量避免。

第三节:常用的抽样方法

首先,随机样本指的是每个个体都以同等的概率被抽到。在抽样调查时,最理想的样本就是随机样本,但随机样本有时候不是那么容易获取。

常用的抽样方法有以下四种:

(1)随机抽样:是指将调查总体的观察个体全部编号,再随机抽取部分观察个体,组成样本。

                           优点:由于总体中每个单位都有同等机会被抽中,所以在样本推论总体时,可用概率的方式客观地判断估计值的可靠程度。

                           缺点:总体较大时,难以一一编号。

(2)分层抽样:是先把要研究的总体按照某些行政分类,再在各类中分别抽取样本。比如:按照教育程度把感兴趣的人群分成几类,再在每一类中调查和该类成比例数目的人,以确保每一类都有相应比例的代表。

                           优点:样本代表性好,抽样误差减小

                           缺点:抽样过程繁杂

(3)整群抽样:指先把总体分成若干群,再从这些群中抽取几群,然后再在这些抽取的群中对个体进行简单的随机抽样。

                            优点:便于组织,节省经费

                            缺点:抽样误差大于单纯随机抽样

(4)系统抽样:是先把总体中的每个单元编号,然后随机选取其中之一,作为抽样开始点进行抽样。在选取开始点之后,通常从开始点开始控制编号,进行所谓等距抽样。由于开始点随机,如果编号随机,所以系统抽样类似于随机抽样。

                           优点:易于理解,简便易行

                           缺点:总体有周期或者增减趋势时,容易产生偏差。

               

第四节:设计调查问卷的原则

(1)合理性:问卷必须紧密与调查主题相关

(2)逻辑性

(3)明确性

(4)全面性

(5)非诱导性

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值