关于T检验以及各种假设检验的操作方法,网络上有很多详细讲解。今天我们不谈具体的步骤,而是通过案例全方面地将T检验的逻辑和思想,掰开揉碎,尝试用白话讲一步,增进大家的理解,不知知足欢迎指出讨论。
案例:5年前,全国男性的平均身高是1.75米(普查得到的总体均值),现在我们想知道如今男性的平均身高是否发生了改变。
思路:从全国男性群体中随机抽取1000名样本,获得样本均值和样本标准差,进行假设检验。
此处需要提醒的是,在进行假设检验时,我们的关注点在样本均值上,即我们不太关注原始样本的情况,而是关注由这个样本计算的样本均值了。
现在,在脑海中重复上面的操作:比如我们随机抽取100次,每次都抽取1000名,所以,我们会得到100个样本均数,将这100个样本均数放在一起再求均数和标准差,得到的均数会更加接近全国这个总体的均数,而这个标准差就是你听过的“标准误”。
然而,现实情况中我们只会抽取一次,只会得到一个样本均数和一个样本标准差,虽然这一个样本均数不如上面由100个样本均数平均后计算地精确,但在数学上仍可以证明,这一个样本均数也可以用来很好地估计总体均数。所以,问题的关键就变成了,不抽取100次,怎么计算“标准误”?好在我们也能证明,只抽样一次获得的样本标准差(S),除以根号N就可以得到“标准误”的估计值了,于是抽样一次就可以简单算出“标准误”,再次提醒,这个“标准误”实际上就是均数的标准差。
现在我们正式开始T检验的思路。上文提到了,我们关注的随机变量已经不