统计假设测验------(一)基本原理(假设测验的两类错误)

1、导论:

一个试验相当于一个样本,由一个样本平均数可以对总体平均数做出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差。用存在误差的样本平均数来推断总体,其结论并不是绝对正确的。把试验的表面效应与误差大小相比较并由表面效应可能属于误差的概率(抽样分布)而做出推论的方法称为统计推断计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成的,有了事先的假设,才能计算概率,这种先做处理无效的假设在依据该假设概率大小来判断接受或否定该假设的过程称为统计假设测验(test of statistical hypothesis)

2、统计假设:差异到底是由什么导致的(随机误差还是真实差异)

H0假设:无效假设(null hypothesis),假设总体参数与某一指定值相等或假设两个总体参数相等,没有效应差异,差异是由误差造成的H1假设:统计假设,对应假设或备择假设(alternative hypothesis),否定无效假设,则必须备择假设。平均数、百分数、变异数、以及多个平均数的比较应在试验前按实验目的提出。试验前,提出无效假设的目的:可从假设的总体里推论其随机抽样平均数的分布,从而可以算出某一样本平均数指定值出现的概率,这样就可以研究样本和总体的关系,从而进行假设测验。

3、统计假设测验的基本方法

假设检验方法是按研究目的提出一个假设,然后通过试验或调查,取得样本资料,最后检验这些资料结果,看是否与无效假设提出的有关总体参数大小相符合。两者符合的可能性不是很小,接受无效假设,符合可能性很小,否定它,接受备择假设。通过总体的分布确定由该总体抽出的样本统计数应该在某一个范围内,如果超出了这个界限,那么就认为无效假设是错误的,接受备择假设。

i:  对所研究的总体首先提出一个无效假设,常为所比较的两个总体间无差异。

    无效假设的意义:以无效假设为前提,可以计算试验结果出现的概率。测试单个平均数,则假设该样本是从一已知总体中随机     抽出的。

ii: 在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率      

    计算概论,正态离差u

           

确定单位测验或双尾测验:计算p值,p<0.05:

(1)这一差异是随机误差,但其出现的概率小于0.05

(2)这一差异不是随机误差,则这一样本不是假设总体中的一个随机样本,其概率大于95%。

计算接收区和否定区,在 假设H0为正确时,根据\overline{y}的抽样分布划出一个区间,如果\overline{y}在这一区间接受原假设(差异属于随机误差),否则在否定区接受备择假设(差异真实存在)。

iii: 小概率事件实际上不可能发生原理接受或否定无效假设
      因随机误差而得到的该差数的概率p<0.05,则这个差数是显著的。

      因随机误差而得到的该差数的概率p<0.01,则这个差数是极显著的。   这种假设检验叫显著性测验。

     用来测验假设的概率标准5%或1%等,叫显著性水平(significance level),一般用\alpha 表示。显著水平,应根据试验的要求或实验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能比较大,则显著水平可选低些,即 \alpha 取大些。反之,若试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则显著水平应高些,即 \alpha 取小些 。显著水平\alpha对假设测验的结论有直接影响,所以应在试验开始前规定下来。 

综上,统计假设测验步骤:

(1)对样本所属的总体提出统计假设,包括无效和备择假设。

(2)规定测验的显著水平 \alpha

(3)在H0为正确的前提下,根据平均数或其他统计数的抽样分布,如正态分布就是那正态离差u值,查表获取因随机抽样而获  得实际差数由误差造成的概率。

(4)\alpha与u比较,或者将试验结果与否定区域相比较,从而做出接受或否定无效假设的推断。                                                

4、两尾测验和一尾测验

     两尾测验(two-tailed test):具有两个否定区。 p=0.05,u=1.96;p=0.01,u=2.58,p代表由随机(抽样)误差造成的概率   

          

     单尾测验(one-tailed test):具有一个否定区。 p=0.05,u=1.64

      

     两尾测验的正态离差|u| >一尾测验的 |u| ,所以一尾测验容易否定假设,在试验前,慎重考虑一尾测验还是两尾。

5、假设测验的两类错误

第一类错误(type I error):不同总体的参数间本来没有差异,可是测验结果认为有差异

    \alpha表示,弃真概率(H0为真),有5%的危险把随机抽样误差当做真实差异

第二类错误(type II error):不同总体的参数间本来有差异,可是测验结果认为没有差异  

   \beta表示,取伪的概率(H0为假), \alpha过小(显著水平过高),会增大第二类错误的概率,增大了把真实差数误认为随机误差的概率。                                               

    总结:

(1)在样本容量n固定的条件下,提高显著水平 \alpha ,  增大第二类错误的概率。

(2)在n和\alpha 相同的条件下,真总体平均数(\mu)和假设总体平均数(\mu0)的相差(以标准误差为单位)愈大,则犯第二类错误概率越小。

(3)为了降低两类错误的概率,采用一个较低的显著水平,同时适当增加样本容量或减小总体方差,或两者兼有之。

(4)若显著水平 \alpha 已固定下来,则改进试验技术或增加样本容量可以有效地降低犯第二类错误的概率。不良的试验设计(观察值太少)和粗放的试验技术,是使试验不能获得正确结论的及其重要原因。在这样的情况下,容易接受任一假设,而不论 这假设是正确的或错误的。                                                                                                   

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值