统计学--变量、数据、抽样

  1. 变量值是变量的取值
  2. 变量的类型
    1.1 分类变量
    1.2 顺序变量
    1.3 数值型变量
    另,根据其取值不同又可分为:离散型变量、连续型变量
  3. 数据处理:将数据用图表等形式展现出来;
    数据分析:选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论,具体方法有描述统计和推断统计。
  4. 推断统计:
    如何利用样本数据来推断总体特征的统计方法。
截面数据时间序列数据
  1. 统计量,根据样本数据计算得出,是样本的函数。
  2. 分类数据和顺序数据,一般是由文字来表述,又被称为定性数据和品质数据。
  3. 变量分类:
    分类变量、顺序变量、数值型变量。

数据的来源:

  1. 间接来源—二手数据
    二手数据优点:搜集容易,采集成本低,并且能很快得到。
    局限性:相关性不够、口径可能不一致、数据也许不准确、也许过时。
  2. 直接来源:
    调查数据、实验数据

二、调查数据

  1. 概率抽样:每一个单位都有一定机会(已知的,可计算的非零概率)被抽到,可以以相等(等概率抽样)也可以不相等(不等概率抽样)。
    特点:随机原则抽取样本;
    概率抽样可以依据调查结果,计算估计量误差,从而得到对总体目标量进行估计的可靠程度。也可以按照要求的精确度,计算出必要的样本数目。
  2. 概率抽样的方式:
    2.1. 简单随机抽样:
    从抽样框(抽样框包含所有总体单位的信息,作用:提供备选单位以供抽选,计算相应的概率)中进行;
    从总体中的N个单位一个一个地抽取,每个单位都是相等的,是一种等概率抽样;
    是一种最基本的抽样方式,是抽样方式的基础;
    特点:简单直观,在抽样框完整的时候,可以直接抽取样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算估计量误差都比较方便
    局限性:当N很大时,抽样框不宜选取;抽出的单位很分散;没有利用辅助信息提高估计的效率。
    2.2 分层抽样
    先划分不同层,然后从各层中抽取。
    保证了样本与总体结构相近。
    2.3 整群抽样
    分组(把这样的组称为群),然后直接抽群,对群中的所有的单位实施调查。
    优点:简化了编制抽样框的工作量,较为简便。
    缺点:估计精度比较差。
    2.4 系统抽样
    对总体中的所有单位进行排序,选取初始单位,按照一定的规则确定其他样本。
    2.5 多阶段抽样
    类似整群抽样,区别是从抽出的群里进行再次抽样,依次推广,即为多阶段抽样。
    优点:样本相对集中,节约调查费用。
    在较大规模的抽样调查中,多阶段抽样经常使用
  3. 非概率抽样:
    特点:抽取样本不遵循随机原则,而是根据研究目的对数据的要求,采用某种方法进行抽样。有如下几种:
    3.1 方便抽样
    依据方便的原则,自行确定入选单位。
    容易实施,但不能将结果推广到总体当中。
    3.2 判断抽样
    根据以往经验,有目的的地选取样本,主观的。又可分为:重点抽样、典型抽样、代表抽样。
    3.3 自愿抽样
    3.4 滚雪球抽样
    先对稀少群体调查,之后再请他们提供另外的调查对象,持续下去。
    特点:适合对特定顶群体进行研究、搜取资料。
    3.5 配额抽样
    类似于概率抽样的分层抽样,先分层、再在各层中进行方便抽样、判断抽样等选取单位。
    搜集数据:
    自填式、电话式、面访式、观察式。
    实验数据:
    随机原则分配给实验组和对照组。
    匹配,情况相同的每队单位分别分配给实验组和对照组。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值