无效比较和有效比较
拥有医疗保险的人与没有医疗保险的人直接比较
组间均值之差 = 平均因果效应 + 选择偏误
随机化
大数定律:随着样本规模不断增加,样本均值接近总体均值(数学期望)
样本规模足够大(大数定律)时,随机试验可以让选择偏误消失(确保被比较的个体所形成的组是类似的)
平衡性检查
为了让样本均值接近期望,如何决定抽取样本的多少(统计精度)?
统计推断
对抽样中存在的不确定性进行量化
偏误:
参数:总体的一个固定特征(如数学期望)
样本统计量:像样本均值这样随样本不同而不同的量
估计量(estimator):用来估计参数的样本数据的函数
无偏估计量:样本统计量的期望等于相应的总体参数
变异性:
样本方差 / 总体方差 / 抽样方差
中心极限定理:当样本规模足够大时,抽样分布接近于标准正态分布
Reference
Angrist, J. D., & Pischke, J. (n.d.). Mastering metrics: The path from cause to effect.