目录
1、大数定律
当样本的数量足够大时,样本的统计特性就可以近似代表总体的统计特性。“大数” 是指样本的数量足够大或者试验的次数足够多。
2、中心极限定理
设总体为 为总体的 N 个样本集,每个样本集都含有一定数量的从总体 A 抽样出的样本,并且这些样本集的均值分别为 。中心极限定理告诉我们,当 N 充分大时(大数定律),无论总体 A 服从什么分布,A 的样本集的均值都服从正态分布。“中心” 可理解为均值附近,“极限” 就是大数定律。
举个例子:
比如要统计武汉的薪资水平。所有武汉人是整体A,从整体中随机抽出多组样本 ,每组样本中有K人,薪资分别为( ),计算每组调查样本的薪资均值 ,得出一系列均值的集合 ,当样本集 N 足够多时, 的分布状况就是近似服从正态分布,如下图所示。
用数学的官方定义就是:
设随机变量序列 相互独立同分布,且数学期望和方差均存在, , ,对任意实数x恒有:
其中, 为标准正态分布函数。