数据分析系列--常见的评估方法

假设检验:t 检验、方差分析

假设检验:

又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。

1、提出检验假设又称无效假设,符号是H0;备择假设的符号是H1

H0:样本与总体或样本与样本间的差异是由抽样误差引起的

H1:样本与总体或样本与样本间存在本质差异

预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。

2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验卡方检验等。

t检验是英国统计学家Cosset在1908年以笔名“" student”发表的,因此亦称 student t检验( Student' s t test)。t检验是用t分布理论来推断差异发生的概率,从而判定两总体均数的差异是否有统计学意义,主要用于样本含量较小(如n<60),总体标准差σ未知,呈正态分布的计量资料。若样本含量较大(如n>60),或样本含量虽小,但总体标准差σ已知,则可采用u检验(亦称:z检验)。但在统计软件中,无论样本量大小,均采用t检验进行统计分析。

t检验和u检验的适用条件:①样本来自正态总体或近似正态总体;②两样本总体方差相等,即具有方差齐性。在实际应用时,如与上述条件略有偏离,对结果亦不会有太大影响;③两组样本应相互独立。根据比较对象的不同,t检验又分为单样本t检验、配对t检验和两独立样本t检验。

两类错误:

假设检验的基本思想是利用“小概率事件”原理做出统计判断的,而“小概率事件”是否发生与一次抽样所得的样本及所选择的显著性水平α有关,由于样本的随机性及选择显著性水平α的不同,因此检验结果与真实情况也可能不吻合,从而假设检验是可能犯错误的  

一般地,假设检验可能犯的错误有如下两类:

①当假设H0正确时,小概率事件也有可能发生,此时我们会拒绝假设H0。因而犯了“弃真”的错误,称此为第一类错误,犯第一类错误的概率恰好就是“小概率事件”发生的概率α,即 

P{拒绝H0/H0为真}=α

②当假设H0不正确,但一次抽样检验未发生不合理结果时,这时我们会接受H0,因而犯了“取伪”的错误,称此为第二类错误,记β为犯第二类错误的概率,即

P{接受H0/H0不真}=β

理论上,自然希望犯这两类错误的概率都很小。当样本容量n固定时,α、β不能同时都小,即α变小时,β就变大;而β变小时,α就变大。一般只有当样本容量n增大时,才有可能使两者变小。在实际应用中,一般原则是:控制犯第一类错误的概率,即给定α,然后通过增大样本容量n来减小B。这种着重对第一类错误的概率α加以控制的假设检验称为显著性检验 

其中详细说明t检验:

单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值