统计量
统计学中最主要的提取信息的方式就是对原始数据进行一定的运算,得出某些代表性的数字,以反映数据某些方面的特征,这种数字称为统计量。用统计学的语言表述就是:统计量是样本的函数,它不依赖于任何未知参数。
推断统计学的重要作用就是,通过从总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质。
统计量在统计学中具有极其重要的地位,它是统计推断的基础。统计量在统计学中的地位相当于随机变量在概率论中的地位。
定义
设是从总体中抽取的容量为n的一个样本,如果由此样本构造一个函数,不依赖与任何未知参数,则成函数是一个统计量。
通常又称为样本统计量。当获得样本的一组具体观测值,代入,计算的数值,就获得一个具体的统计量值。
常用统计量
根据上述可知,统计量是样本的一个函数,不同的推断问题要求构造不同的统计量。要注意的是,依赖于总体分布的未知参数不属于统计量,比如数学期望和方差。
下列为常用的统计量:
抽样分布
近代统计学创始人之人,英国统计学家费希尔曾把抽样分布、参数估计和假设检验看做统计推断的三个中心内容。
若对任一自然数n都能导出统计量的分布的数学表达式,这种分布成为精准的抽样分布。它对样本量n较小的统计推断问题非常有用。精准的抽样分布大多是在正态总体情况下得到的。在正态总条件下,主要有分布、分布、分布,常称为统计三大分布。
抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能样本的平均数所形成的分布,就是样本平均数的抽样分布。
从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
三大抽样分布是数理统计上的三个重要分布,由标准正态分布的总体样本组合而成。三大抽样分布一般是指:
- 卡方分布(分布)、
- t 分布
- F分布
卡方分布(Chi-square distribution)
卡方分布又叫:西格玛分布
设随机变量相互独立,且服从标准正态分布,则它们的平方和服从自由度为的分布。
自由度是统计学中常用的一个概念,它可以解释为独立变量的个数,还可以解释为二次型的秩。例如,是自由度为1的分布,