第一章 导论
1.1 统计数据的类型
- 分类数据 性别 企业属性
- 顺序数据 比如产品分为一等品 二等品 三等品 次等品等
- 数值型数据 按数字尺度测量的观测值
现实中所处理的大多数都是数值型数据
1.2 总体&样本
总体:是包含所研究的全部个体(数据)的集合。
样本:是从总体中抽取的一部分元素,构成样本的元素的数据成为样本量。抽样的目的是根据样本提供的信息推断总体的特征。
第二章 数据的搜集
2.1 数据的来源
间接来源:数据是由别人通过调查或实验的方式搜集的,使用者只是找到他们并加以使用。
直接来源:通过自己调查或实验活动,直接获得的第一手数据。
2.2 调查数据
2.2.1 概率抽样和非概率抽样
按照使用抽样采集数据的方式分为两大类:概率抽样和非概率抽样
- 概率抽样 也叫随机抽样
- 简单随机抽样 (simple random sampling)
- 分层抽样 (stratified sampling)
- 整群抽样 (cluster sampling)
- 系统抽样 (systematic sampling)
- 多阶段抽样 (multi-stage sampling)
- 非概率抽样
- 方便抽样
- 判断抽样
- 自愿样本
- 滚雪球抽样
- 配额抽样