概念
统计可以分为两块,一是统计描述,就是你的数据长什么样子,二是统计推断,就是根据你的数据讨论下理论总体长什么样子。
统计推断是 依据总体理论分布(u分布、t分布、二项分布、泊松分布、卡方分布、F分布等),从样本的统计数对总体的参数做出推断。
统计推断 包括 假设检验 和 参数估计。其中假设检验又被称为显著性检验。
1.假设检验
假设检验又称为显著性检验,根据总体的理论分布和小概率原理,对未知或者不完全知道的总体提出两种对立的假设,然后根据样本统计数进行计算,做出在一定概率意义上的选择,即应该接受哪一种假设。
1.1假设检验步骤
(三)计算概率:在H0正确的情况下,根据样本统计数计算抽样误差出现的概率。
1.2单尾假设检验与双尾假设检验
1.3假设检验的两种错误
1.4平均数检验
大概可以分为两种情况:一是一个样本然后与总体比,二是两个样本然后相互比。
同时呢,还要分为总体方差知不知道,以及样本容量大不大这些情况。
1.4.1 一个样本的平均数检验
来自正态分布的样本平均数的分布符合N(μ,σ^2/n),即使总体分布不符合正态分布,抽样次数足够大时,样本平均数的分布也符合正态分布。
1.4.1.1 方差已知
1.4.1.1 方差未知,但是样本容量大
1.4.1.1 方差未知,但是样本容量小
1.4.2 两个样本的平均数检验
来自两个正态总体的抽样,两个样本平均数的差数符合正态分布
1.4.2.1 两个样本对应的总体方差已知
1.4.2.1 两个样本对应的总体方差未知,但是样本容量大
1.4.2.1 两个样本对应的总体方差未知,但是样本容量小
此时应该使用t检验,而且还需要分情况:总体方差是否一样,抽样容量是否一样,是成对数据还是成组数据等情况。
- 就是这些假设检验不仅仅是提出来H0和HA两个假设,然后根据H0正确进行计算,其还有其他前提条件,尤其是方差齐性。
- 成对数据的假设检验
1.5频数/频次检验
1.5.1一个样本的频数检验
- np/nq < 5
1.5.2两个样本的频数检验
1.6方差齐性检验
从样本方差推断总体方差是否一致。
- 为什么要做方差齐性的检验呢?
方差大小反应了样本的变异程度或者说离散程度。如果平均数一样,方差不一样的两个总体,在正态分布曲线上是两个高低不一样的曲线系统。抽样后,用样本统计数推断总体参数的时候,这些差异是总体差异还是波动差异造成的说不清楚。
1.6.1 一个样本的方差同质性检验
1.6.2 两个样本的方差同质性检验
1.6.3 多个样本的方差同质性检验
2.参数估计
参数估计是统计推断的另一个方面,它是指由样本的统计数在一定概率水平下对总体参数所做的估计。
2.1单样本平均数的区间/点估计
2.2样本平均数差数的区间/点估计