要点:
一、正态分布是统计学的基础,它对于各种假设检验极其的重要,t分布,F分布,卡方分布都是基于正态分布衍生出来的,而且中心极限定理也证明了,多数分布在样本量n足够大的情况下,其样本均值服从正态分布。
二、假设检验的步骤
1 提出假设,包括无效假设H0和备择假设H1。
2 预设检验水准,一般设为0.05,概率小于0.05为小概率事件
3 选定检验方法,检验方法的选定要依据抽样的样本数量等因素进行确定
4 依据检验方法,确定在H0假设下的发生概率,如果小于0.05,则证明,H0假设为小概率事件,就可以拒绝H0
三、假设检验的实质是否定,是为了否定H0。
一、u检验(总体均值,总体方差已知的情况下使用)
u检验,又称为z检验,是基于正态分布的检验。举个简单的例子:
一台机器生成某种金属球,直径服从正态分布N(10,0.04)。抽取100个样本后,发现样本的均值为9.8cm,请问该机器生产的产品直径的均值是否为10cm。在0.05的显著性水平下
1、H0: H1:
2、取
3、样本量为100,所以这里选择u检验(为什么会选择u检验,而不选择t检验?在总体方差已经知道的情况下,不管样本数量多少都可以选择u检验。而如果总体方差未知,且样本数量小于40,则应该选择t检验。那么如果总体方差未知,但是样本数量超过40了,则u检验和t检验都可以使用,因为样本量大的情况下,t分布趋向于正态分布)
4、计算
可以发现这里是双边检验,所以查=1.96。所以拒绝H0
二、t检验(总体均值已经知道,但总体方差未知,只知道样本的方差)
(一)、单总体t检验
一台机器生成某种金属球,直径服从正态分布。抽取16个样本后,发现样本的均值为9.8cm,方差为0.04,请问该机器生产的产品直径的均值是否为10cm。在0.05的显著性水平下
1、H0: H1:
2、取
3、总体方差未知,样本量为16,所以这里选择t检验(如果样本数量较大,比如超过40,亦可以选择u检验)
4、计算
查,所以拒绝H0
(二)、两总体t检验(这两个总体的方差齐,且服从正态分布)
两台机器A,B生产某种金属球,从A生产的产品中取16件,发现其均值为9.8cm,方差为0.04,从B生产的产品中取9件,发现其均值为9.7cm,方差为0.015,是否可以认定A,B产品的直径有显著性差异,在0.05的显著性水平下。
1、H0: H1:
2、取
3、判断两个总体的均值是否有显著性差异,要用t检验
4、计算
,所以接受H0。
三、卡方检验(总体均值未知,单个正态总体的卡方检验,卡方检验的目标是为了检验样本的总体是否符合某种分布)
一台机器生成某种金属球,直径服从正态分布。抽取16个样本后,发现样本的均值为9.8cm,方差为0.04,请问该机器生产的金属球的直径的方差是否为0.02。
1、H0: H1:
2、取
3、总体均值未知,样本量为16,所以这里选择卡方检验
4、计算
查,所以拒绝H0,说明金属球的直径不符合方差为0.02的正态分布。
注:卡方检验还有另一种计算方式为
四、F检验(总体均值未知,两个正态总体的F检验,F检验的目标是为了检验两个样本的总体的方差是否相同,t检验中的方差齐是可以用F检验来进行检验的)
两台机器A,B生产某种金属球,从A生产的产品中取10件,发现其方差为0.02,从B生产的产品中取10件,发现其方差为0.015,是否可以认定A,B产品的方差相等,在0.05的显著性水平下。
1、H0: H1:
2、取
3、判断两个总体的方差是否齐,要用F检验
4、计算
将数据带入得到F=1.333,查,所以接受H0,说明在0.05的显著性水平下可以认为方差相等。