1.统计推断与假设检验:
统计推断就是根据随机样本的实际数据,对总体的数量特征做出具有一定可靠程度的估计和推断。统计推断的基本内容有参数估计和假设检验两方面。
研究一个随机变量,推断它具有什么样的数量特征,按什么样的模式来变动,这属于估计理论。而推测这些随机变量的数量特征和变动模式是否符合事先所做的假设,这属于检验理论。
参数估计和假设检验的异同点:参数估计和假设检验的共同点是他们都对总体物质或不是很了解,都是利用样本观察值所提供的信息,对总体的数量特征做出估计和判断,但二者所要解决问题的着重点及所用方法有所不同。
假设检验:
1)当总体分布已知(如总体为正态分布)的情况下,对总体包含的参数进行推断的问题称为参数检验
2)当总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断,通常采用的统计推断方法是非参数检验方法。
假设检验的基本思想:
反证法及小概率原理。其原理就是首先在原假设正确的条件下计算出现该样本或样本统计量的概率,如果这种事件发生的概率很小,比如小于5%,那么就拒绝原来的假设,而接受备择假设。
假设检验的几个概念:
1)统计假设:
原假设:在很多情况下,我们给出一个统计假设仅仅是为了拒绝它。比如:如果要判断给定的一枚硬币是否均匀,则假设硬币是均匀的(即p=0.5,其中p是正面出现的概率),又比如:如果要判断一种方法是否由于其他方法,则假设两种方法之间没有差异。这样的假设通常称为零假设或原假设,记为H0.
备择假设:任何不同于零假设的假设都称为备择假设。比如:如果零假设是p=0.5,则备择假设是p≠0.5,备择假设记为H1.
2)假设检验的两类错误:
第一类错误:在假设检验中拒绝了本来是正确的零假设,称为“弃真”错误。
第二类错误:在假设检验中没有拒绝本来是错误的零假设,称为“取伪”错误。
3)显著性水平:在作假设检验时,犯第一类错误的最大概率称为检验的显著水平,这个概率常记为p,通常抽样前就指定好,这样得到的结果才不会影响我们的选择。
在实际问题中,显著性水平可以有多重选择,但最为普通的是0.05和0.01.比如:如果设计一个决策法则选择的显著性水平是0.05(5%),那么在100次中可能有5次机会使我们拒绝本该接受的假设,即,大约有95%的把握做出正确的决策,此时,我们说拒绝假设的显著性水平为0.05,即犯拒绝本应该接受的假设这类错误的概率是0.05.
4)概率p值:
p值是当原假设正确时,观测到的样本信息出现的概率。如果这个概率很小,以至于几乎不可能在原假设正确时出现目前的观测数据时,我们就拒绝零假设。p值越小,拒绝原假设的理由就越充分。通常是与预先设定的显著性水平值比较,若值为0.05。p值小于0.05则认为该概率值足够小,应拒绝原假设。
5)假设检验的基本步骤:
1.建立假设:
根据统计推断的目的而提出的对总体特征的假设。统计学中的假设有两方面的内容:
一.是检验假设,也称为原假设或零假设,记为H0
二.是与H0相对立的备择假设,记为H1.后者的意义在于当H0被拒绝时供采用。两者是互斥的,非此即彼。
H0:u=u0 H1:u≠u0
2.选择检验统计量
在统计推断中,总是通过构造样本的统计量并计算统计量的概率值进行推断,一般构造的统计量应服从或近似服从常用的一致分布,例如均值检验中常用的t分布或F分布。
2.在给定显著性水平条件下,做出统计推断结果
显著性水平指的是当假设正确时被拒绝的概率,即弃真概率,一般取0.01或0.05.当检验统计量的概率p值小于显著性水平时,则认为此时拒绝零假设而犯弃真错误的概率小于显著性水平,即低于预先给定的水平,即犯错误的概率小到能我们能容忍得范围,此时可以拒绝原假设;繁