样本数量:从总体中抽取了几个样本
样本大小:这个样本中包含了多少个数据
1. 用样本来估计总体平均值
中心极限定理:
任何样本的平均值约等于总体的平均值。(前提是样本大小达到30%)
无论总体是什么分布,所有样本的平均值会在总体平均值周围呈现正态分布,样本大小越大就越接近于正态分布。
演示中心极限定理的游戏:http://onlinestatbook.com/stat_sim/sampling_dist/index.html
例如:抽取5个样本,每个样本有100个数据,用这100个数据求出每个样本的平均值,这5个样本的平均值都接近于总体的平均值。且这5个平均值会在总体平均值周围呈现正态分布,样本大小越大就越接近于正态分布。
2. 用样本来估计整体标准差(数值与平均值偏离程度)
样本标准差要小于整体标准差,所以公式中是除以(n-1)。
3. 根据总体信息,判断某个样本是否属于总体
标准差和标准误差
标准误差用来衡量样本平均值的波动大小。
标准误差也是标准差,只不过它的计算对象是所有样本平均值。