目的:比较样本均数 所代表的未知总体均数μ和已知总体均数μ0。
计算公式:
t统计量:
即:

自由度:v=n - 1
适用条件:
(1) 已知一个总体均数;
(2) 可得到一个样本均数及该样本标准误;
(3) 样本来自正态或近似正态总体。
为什么要t检验或者其他检验呢,是因为 样本参数=总体参数+机会误差+偏差,现在我们手里有样本,可以计算样本参数,但是我们想知道的是总体参数,但是这个样本参数能不能代表总体参数呢?
排除法,t检验在这里就是用来判断是否是机会误差这个因素造成,通俗点说就是样本得到的参数值可不可能由于是抽取的时候的随机造成的。
标准正态分布下,约95.5% 样本落在 +/-2 sigma区间内。而p=0.05自身意味着样本统计有95%的信心拒绝原假设。
同理,+/-3 sigma 占标标准正态区间99.7,约合p=0.01。
举例:
1.
p-value是一种概率:在原假设为真的前提下,出现该样本或比该样本更极端的结果的概率之和。
例子:
我们假设
H0:出现正面的概率是1/2
扔硬币20次出现了14次正面.该样本的单边p-value计算如下:
考虑双边检验时候,p-value是单边的二倍,即0.115
2.