-------------本章内容来源:python统计分析第八章----------------------------
标准差和标准误的概念:
-
标准差定义为各测量值误差的平方和的平均值的平方根,故又称为均方误差;
-
标准误反映的是样本均数之间的变异(即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度)。也表示的是抽样的误差。因为从一个总体中可以抽取出多个样本,每一个样本的数据都是对总体的数据的估计。标准误代表的就是当前的样本对总体数据的估计,标准误代表的就是样本均数与总体均数的相对误差。标准误是由样本的标准差除以样本人数的开平方来计算的。从这里可以看到,标准误更大的是受到样本人数的影响。样本人数越大,标准误越小,那么抽样误差就越小,就表明所抽取的样本能够较好地代表样本。
1.单样本均值的t检验:
检验一个正态分布的数据的均值和参考值的差异,我们一般使用单样本t检验,该检验基于t分布。
eg:我们从均值为7,标准差为3的正态分布中抽取100个数据,那么得到一个和该均值的差距>=0.5的可能性有多大?
在这个例子中,来自t检验的概率是0.057,来自正态分布的概率是.0054.
本例子中抽取的100个样本,均值为7.10,样本的标准差为3.12,均值的标准误是0.312.
-----未完待续---------------