本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。
2 抽样分布基本概念
参数(parameter):参数是对总体的数值描述,因为是总体,所以值经常是未知的。
样本统计量(sample statistics):样本的数值描述,利用样本计算而来。
常见的参数和样本统计量如下表所示。
总体参数 | 样本统计量 | |
---|---|---|
均值 | μ | x¯ |
中位数 | η | m |
方差 | s2 | |
标注差 | σ | s |
二项比率 | p^ |
抽样分布(sampling distribution):统计量的概率分布,根据n个测量值的样本计算得到。
2 抽样分布的性质
性质一:无偏性
无偏估计(unbisaed estimate):样本统计量的抽样分布均值和要估计的总体参数相等,就认为这个统计量是参数的无偏估计。
有偏估计(biased estimate):抽样分布的均值和要顾及的参数不相等,就认为这个统计量是参数的有偏估计。
性质二:最小方差
如果两组统计量的抽样分部都无偏,我们更加倾向选择标注差最小的,抽样分部的标准差也被成为统计量的标准误(standard error of the statistic)。
3 样本均值的抽样分布和中心极限定理
3.1 x¯ 的抽样分部的性质:
x¯ 的抽样分布的性质:
1.抽样分部的均值等于抽样总体的均值,即 μx¯=E(x¯)=μ 。
2.抽样分部的标准差等于:
抽样总体的标注差样本量的平方根,即σx¯=σn√ 。(标准差 σx¯ 一般被称为均值的标准误(standard error of the mean)。
3.正态分布的抽样分布:如果从一个服从正态分布的总体中选取一个有n个观测值的随机样本,那么 x¯ 的抽样分布也是一个正态分布。
3.2 中心极限定理
从一个均值为
μ
、标准差为
σ
的总体中选取一个有
n
个观测值的随机样本。那么当
4 样本比例的抽样分布
和样本均值是总体均值的良好估计一样,样本比例(记为 p^ ),是总体比例 p 的良好估计。和样本均值的抽样分布有着类似的性质。
p^ 的抽样分布性质:
1. 抽样分布的均值等于二项比例 p ,也就是E(p^)=p 。因此, p^是p 的无偏估计。
2. 抽样分布的标准差等于 p(1−p)/n−−−−−−−−−√ ,即 σp^=p(1−p)/n−−−−−−−−−√ 。
对于大样本,抽样分布近似于正太。