假设检验(Hypothesis Testing)的内涵及步骤

    假设检验是用来判断样本样本样本总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 
       
    生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。
  在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。假设检验的思想是,先假设两者相等,即:μ=μ0,然后用统计的方法来计算验证你的假设是否正确。

 假设检验的基本思想:
1.小概率原理
  如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。
  
小概率原理
2.假设的形式
  H0——原假设, H1——备择假设
  双尾检验:H0:μ = μ0 ,
H_1:\mu\ne\mu_0
  单尾检验:
H_0:\mu\ge\mu_0
 ,H1:μ < μ0 
H_0:\mu\le\mu_0
, H1:μ > μ0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。
    假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P<0.01或P<0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。
    根据P值大小,一般按以下标准作出判断:


假设检验的原理:
一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。
  假设检验使用了一种类似于“反证法”的推理方法,它的特点是:
  (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
  (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。

假设检验的种类:
假设检验可分为正态分布检验正态总体均值分布检验非参数检验三类。
  正态分布检验包括三类:JB检验、KS检验、Lilliefors检验,用于检验样本是否来自于一个正态分布总体。
  正态总体均值检验检验分析方法和分析结果的准确度,考察系统误差对测试结果的影响。从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。
  正态总体均值检验分为两种情况,
   t检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显著性,分为单侧检验与双侧检验。当为双样本检验时,在两样本t检验中要用到F检验。
从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。
    Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。
  上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。
    统计工具箱提供了符号检验秩和检验两种非参数检验方法。

假设检验的规则与两类错误:    
1.确定检验规则
  检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0。
差异
临界点
判断
c
拒绝H0
c
接受H0
  怎样确定c?
2.两类错误
在假设检验中,由于随机性我们可能在决策上犯两类错误:
        第一类是假设正确,但我们拒绝了假设,这类错误是“弃真”错误;
        第二类是假设不正确,但我们没拒绝假设,这类错误是“取伪”错误;
    一般来说,在样本确定的情况下,任何决策无法同时避免两类错误的发生,即在避免第一类错误发生机率的同时,会增大第二类错误发生的机率;或在避免第二类错误发生机率的同时,会增大第一类错误发生的机率。人们往往会根据需要选择对那类错误进行控制,以减少发生这类错误的机率。大多数情况下,人们会控制第一类错误发生的概率。
    发生第一类错误的概率被称作显著性水平,一般用阿尔法表示,在进行假设检验时,是通过事先给定显著性水平阿尔法的值来控制第一类错误发生的概率。

  接受或拒绝H0,都可能犯错误
  I类错误——弃真错误,发生的概率为α
  II类错误——取伪错误,发生的概率为β
检验决策
H0为真
H0非真
拒绝H0
犯I类错误(α)
正确
接受H0
正确
犯II类错误(β)
  α大β就小,α小β就大
  基本原则:力求在控制α前提下减少β
    α—显著性水平,取值:0.1, 0.05, 0.001, 等。如果犯I类错误损失更大,为减少损失,α值取小;如果犯II类错误损失更大,α值取大。
  确定α,就确定了临界点c。
  ①设有总体:X~N(μ,σ2),σ2已知。
  ②随机抽样:样本均值\bar{X}~N(\mu,\sigma^2/n)。
  ③
\bar{X}
标准化:
Z=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}~N(0,1)
  ④确定α值,
  ⑤查概率表,知临界值
\left|Z_{\frac{a}{2}}\right|
  ⑥计算Z值,作出判断。            



假设检验中应注意的问题:
    1、做假设检验之前,应注意资料本身是否有可比性
  2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义
  3、根据资料类型和特点选用正确的假设检验方法。
  4、根据专业及经验确定是选用单侧检验还是双侧检验。
  5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
  6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
  7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。

假设检验与置信区间的关系:
    假设检验与置信区间有密切的联系,我们往往可以由某参数的显著性水平为α的检验,得到该参数的置信度为1—α的置信区间,反之亦然。例如,显著性水平α的均值μ的双侧检验问题:
  H0:μ = μ0, 
H_1:\mu\ne \mu_0
  与置信度为1-α 的置信区间之间有着这样的关系;若检验在α水平下接受H0,则μ的1 - α的置信区间必须包含μ0;反之,若检验在 α水平下拒绝H0,则μ的1-α的置信区间必定不包含μ0。因此,我们可以用构造μ的1-α置信区间的方法来检验上述假设,如果构造出来的置信区间包含μ0,就接受H0;如果不包含μ0就拒绝H0。同样给定显著水平 α,可以从构造检验规则的过程中,得到μ的 1-α置信区间。 如上例,μ的置信度为95%的置信区间为:
  
\bar{x}-1.96\times\frac{\sigma}{\sqrt{n}}=83-1.96\times\frac{5}{16}=83-2.45=80.55
  
\bar{x}+1.96\times\frac{\sigma}{\sqrt{n}}=83+2.45=85.45
即置信区间为(80.55 , 85.45),因为μ0 = 80,不在这个区间内,拒绝H0。

几种常见的假设检验:
 考虑下面三种类型的假设检验:
  (1)
H_0:\mu=\mu_0,H_1:\mu\ne\mu_0
(双边检验)
  (2)
H_0:\mu\le\mu_0,H_1:\mu>\mu_0
(右侧单边检验)
  (3)
H_0:\mu\ge\mu_0,H_1:\mu<\mu_0
(左侧单边检验)











没有更多推荐了,返回首页