统计学—数据的搜集

文章探讨了数据的来源,包括直接的一手资料和间接的二手资料,分析了它们的优缺点。接着详细介绍了抽样方法,如概率抽样和非概率抽样,以及各种类型的抽样技术。此外,还讨论了数据误差的类型,如抽样误差和非抽样误差,并提出了控制误差的策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

一、数据的来源

二、调查方法

三、数据的误差


一、数据的来源

        数据的来源分为直接来源和间接来源,其中直接来源是指通过调查和实验的方法直接获取的一手资料;间接来源是指与研究内容有关的原信息已存在,只是对原信息进行重新加工、整理,使之成为我们进行统计分析可以使用的数据,称为间接来源的数据,即二手资料。

一手资料和二手资料的优缺点:

一手资料优点:针对性强。缺点:成本高,不易搜集。

二手资料优点:成本低,易搜集,作用广泛。 缺点:相关性不够,容易出现口径不一致,时效性不够等问题。

二、调查方法

        调查方法分为抽样方法和搜集方法。

        抽样方法:分为概率抽样和非概率抽样。其中概率抽样是遵循随机原则进行的抽样,即每个单位都有一定机会被选入样本。非概率抽样是不依据随机原则,根据研究目的对数据的要求,采用某种方式 从总体中抽出部分单位对其调查。


        概率抽样与非概率抽样的特点:

        概率抽样:①依据随机原则 ②可用样本推断总体 ③可以满足特定精度要求
所需样本量 ④技术含量更高,专业性更强,成本高
        非概率抽样:①不依据随机原则,样本量分布不确切 ②操作简单,时效快,
成本低 ③专业技术要求不高 ④适用于探索性研究和概念测试 ⑤不可适用于估
计总体参数
        概率抽样分类:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样
        非概率抽样分类:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样

        搜集方法:自填式、面访式、电话式


三、数据的误差

        造成统计数据误差的原因有哪些?如何减少和控制统计数据中的误差?

         统计数据的误差是指通过调查搜集到的样本结果与总体真值之间的差异。数
据的误差有两类:抽样误差和非抽样误差。
        抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差,通过增
加样本量可以减少抽样误差,当样本量大到和总体单位相同时,也就是抽样调查
变成普查时,抽样误差较小到 0。
        非抽样误差是指除抽样误差以外的,由于其他因素引起的样本观察结果与总
体真值之间的差异。非抽样误差包括抽样框误差、回答误差、无回答误差、调查
员误差、测量误差等。非抽样误差的控制主要是控制调查的质量,包括对调查员

的筛选、培训等。

数据误差的影响因素:

①样本单位数目,在其他条件不变的情况下,样本量越大,抽样误差越小,
当 n=N 时,抽样误差为 0;
②总体标志变异程度,在其他条件不变的情况下,总体标志变异程度越大,
抽样误差越大;
③抽样方法,一般情况下,不重复抽样的抽样误差要小于重复抽样的抽样误
差,当 n 相对于 N 非常小时,两种方法之间的差异可以忽略不计;
④抽样组织方式,采用不同的抽样组织方式,也会有不同的抽样误差,一般
情况下,分层抽样的抽样误差较小,整群抽样的抽样误差较大。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

那个叫马尔的大夫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值