先上结论:
t分布并不是仅仅用于小样本(虽然小样本中用的风生水起)中,大样本依旧可以使用。t分布与正太分布相比多了自由度参数,在小样本中,能够更好的剔除异常值对于小样本的影响,从而能够准确的抓住数据的集中趋势和离散趋势。
卡方检验在很多课本中被认为是非参数检验的一员,但从分布假设来说,他属于参数检验。卡方分布(x2)是K个服从 正太分布的随机变量的平方和所服从分布。其参数只有自由度一个,当自由度很大时,X2近似服从正太分布。
F分布是两个服从卡方分布的随机变量各自除以他们的自由度的商。
正太分布是以上所有分布的基础。
具体性质:
以下内容仅为参考:
t分布-命名与源起
“t”,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为“Student's distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布,在国外更多的被称为高斯分布)
t分布的性质:厚尾性
具体长处:研究样本量的估计量更小。标准差是样本量计算的一个重要参数,t分布能够很好的消除异常值带来的标准差波动,