一、统计量
样本均值:即在总体中的样本数据的均值,反映样本数据的集中趋势。
样本方差:每个样本值与全体样本值平均数之差的平方值的平均数;方差是用来衡量随机变量和其数学期望(均值)之间的偏离程度。
样本变异系数:变异系数又称为离散系数,定义为标准差与平均值之比,样本变异系数即样本数据的标准差与其均值之比。
样本k阶中心矩:在概率论中,矩是用来描述随机变量的某些特征的数字,即求平均值;随机变量X的K阶中心矩定义:对于正整数k,如果E(X)存在,E[(X-E(X))^K] <无穷大,则E[(X-E(X))^K] 为x的k阶中心矩。
样本偏度:常用作总体偏度的估计量和检验总体分布正态性的统计量,样本三阶中心距除以二阶中心距的3/2次幂的商记为SK;而总体偏度是一个描述总体分布不对称性的数字特征,正态分布的偏度为0。
样本峰度:常用以作为总体峰度的估计量,样本的四阶中心距除以样本二阶中心距平方的商再减去3,记为ku;正态分布的峰度为0。
二、抽样分布
中心极限定理:即不论总体服从什么分布,只要从总体中抽取的样本容量足够大,这些样本组成的样本均值的抽样分布都近似于正态分布。
样本方差的分布:作为随机变量的函数,样本方差本身就是一个随机变量,S^2服从卡方分布,
![equation?tex=%5Cfrac%7Bs%5E2%7D%7B%5Csigma+%5E2%7D%28n-1%29%5Csim+X%5E2%28n-1%29](https://i-blog.csdnimg.cn/blog_migrate/e505a4aa7fecc1f14035e2325890c318.png)
卡方分布:
卡方统计量是一个随机变量,能够表明样本方差和总体方差之间对的比值关系,卡方统计量决定的抽样分布就是卡方分布;
卡方统计量:
![equation?tex=%5Cchi%5E2%3D%5Cfrac%7B%28n-1%29s+%5E2%7D%7B%5Csigma+%5E2%7D](https://i-blog.csdnimg.cn/blog_migrate/75d33aa46885210e7498480246a8cd51.png)
定义:若样本量为n的所有可能样本均取自方差为
![equation?tex=%5Csigma%5E2](https://i-blog.csdnimg.cn/blog_migrate/11cb78bc3a47e3927256f70657ffa63e.png)