注:文章为个人的抽样课程复习提纲,非教程讲解
第一章 绪论
1.数据的两种类型:
- 实验数据 (可控条件、实验次数可无限)
- 调查数据(时效性、有误差、方式多样)
2.抽样调查
非全面,指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取样本进行调查,获得有关总体目标量的了解。(将样本统计量作为总体参数的估计量,通过样本推断总体性质)
3.非概率抽样与概率抽样
区别:是否依据随机原则
注意点:随机≠随便(例:对小区居民的抽取)
4.估计量方差、偏差、均方误差
- 方差是由样本的随机性产生的,随样本量的增加而减少。
- 偏差是偏向某个方向的系统性误差。
- 若偏差为0,则称为无偏估计,此时总体参数theta估计的期望就等于真实值。
- 无偏估计不一定比有偏估计好,一般把MSE(均方误差)作为评价抽样方案优劣的标准。
5.精度与费用
第二章 简单随机抽样
1.简单随机抽样的“简单”之意
- 待估总体参数与用于估计的统计量两者“同形同构”
- 直接从总体(而不是层之类的子总体)抽取个体
- 简单随机抽样是任何其他概率抽样方式的核心内容
- 容易操作(如:掷骰子)
2.相关公式
2.1 简单随机抽样:
2.2 比率估计:
2.2.1 比率估计量为有偏估计
(在大样本条件下,可近似等)
2.2.2 辅助变量的特点:
- 辅助变量必须与主要变量高度相关;
- 辅助变量与主要变量间的相关关系整体上相当稳定;
- 辅助变量的总体总值必须是已知的,或是容易获得的
- 辅助变量的信息质量更好,或信息更容易取得即调查成本更低。
2.3 回归估计
第三章 分层随机抽样
第四章 整群抽样
- 以群为单位随机抽取
- 群中所有单位都被抽取(f2=1)
- 影响整群抽样误差大小的主因素是群间方差
相关公式依前推到即可。