为了准备一个笔试学了几小时的t检测(student's t test)。废话不多说,总结如下。
统计学一个重要的思想是用样本估计总体,但这样会存在估计不准的风险(术语把握度和可信度衡量这种风险,但把握度一般估计不出来)。只要风险较小我们是可以下一“假设”的。
于是假设检验应运而生。
基本思想是先下一个假设,使用样本数据和总体的先验知识来计算假设(或比假设更极端的情况)出现的概率,如果概率满足可信度要求则认为假设成立。
对不同参数(如均值,方差等)有不同的假设和检验方法。
一般来说样本的数据时齐全的,比如均值、方差甚至是原始数据都是可以利用的。但总体的先验知识就不一定了。
比如只知道总体均值、总体方差、总体分布等(一般均值最容易得到,而分布情况最难得到)。
下面给出几个经典的场景和假设检验方法。
1. 总体均值和方差皆已知使用u检测估计样本均值是否合乎总体均值。
(这里有个”总体“有两个不同的含义,举个例子吧。
想知道一所学校的学生平均身高是否符合全国学生平均身高的标准,于是我们从学校中抽出100名学生的身高作为样本。
接下来,”总体“就有歧义了。它即可以侠义地指这所学校的学生身高(100名学生身高样本的对立面),也可以广义地指全国学生的身高。
所以要根据具体的语境辨别。这里用的是广义的总体)
原理: 样本均值服从正态分布。统计量u=|u1-u0|/(s0/√n)符合标准正态分布。计算出现u1的概率,即p值,看是否满足可信度要求。
实际上一般直接比较界限值,其实界限值就是由p值和分布反推出的”正常“参数的临界值。
2. 直知道总体均值使用s检测估计样本均值是否合乎总体均值。
直接用样本方差最为总体方差,然后使用u检测。
3. 样本容量较小、只知道总体均值且总体服从正态分布,使用t检测估计样本均值。
统计量t和统计量u的计算方法一样,但多一个自由度参数v(衡量样本容量n带来的影响,v=n-1)并且使用t分布而非正态分布来确定界限值。
t分布的用途很广,可以做 a)样本均值和总体均值的比较; b)配对资料的比较; c)两样本均值的比较;d)两方差齐次性检验(即方差是不是相等)。
具体怎么做我就不一一解释了,可以参见百度文库《假设检验的概念及t检验.ppt》。
这篇博文完全来自这个ppt,文中也提到了如何把非正态分布的数据加工成近似的正态分布的数据,值得一读。