# 2013.9.4
#---------------------------------------------抽样---------------------------------
1,样本选取的时候,要考虑两个点:
a>偏差:当我们取很多样本时,统计量一直朝同一个方向偏离总体的参数值。
b>变异性:当我们取很多样本时,统计量的值会离散到什么程度。变异性大,就代表不同样本结果可能差别很大。简单来说,不同的抽样样本,统计结果彼此差异很大。
一个好的抽样方法,应该要有小偏差和小变异性。变异性跟样本大小有关,跟总体大小无关。
2,如何处理偏差和变异性:
a>可以通过随机抽样,减少偏差。比如,列出总体,从中简单抽样,得到无偏估计值;
b>通过大样本量,减小变异性。
3,误差界限
其实,误差界限,就是把“变异性”,转成一种我们对调查结果有多少信心的叙述来表达。
误差界限 = 1/ sqrt(N),N表示样本大小;
从上述公式看到,样本越大,误差界限也越小;减少一半的误差界限,要用4倍的样本大小。
4,置信叙述
置信叙述包括两个部分:误差界限(margin