统计学基本知识 # datawhale 任务三

假设检验

基本原理

假设检验是数理统计中根据一定假设条件由样本推断总体的一种方法,依据的原理是小概率事件原理,即小概率事件在一次试验中是几乎不可能发生的。

基本概念与基本步骤

基本步骤

  1. 建立假设——原假设与备择假设
    原假设记作 H 0 H_0 H0,是指待检验的假设,一般为研究者想要收集证据反对的,没有充分理由否定的假设。
    备择假设记作 H 1 H_1 H1,是指与原假设相对的假设,一般为研究者想要收集证据支持的,没有充分理由肯定的假设。
    一般来说是相互对立的,但有时可能存在既拒绝原假设又无法接受的备择假设的情况。
  2. 确定适当的检验统计量(t,p,z)并计算。
    (1) 在样本容量<30,且总体方差 σ \sigma σ未知时,采用t-统计量进行假设检验。即指定抽样分布服从t分布,并查阅分布表进行对比。
    (2)在样本容量>30,且总体方差已知(若样本容量<30也可以)时,采用z-统计量进行假设检验。即抽样分布服从正态分布,并查阅z-值表进行对比。
    (3)样本容量>30,也可以通过计算p值,并与显著性水平 α \alpha α进行对比进行检验。p值指小概率事件发生概率,显著性水平则指拒绝原假设的概率( α \alpha α通常很小,由人为决定)
  3. 给定显著性水平,确定拒绝域,并进行判断
    检验统计量若落入抽样分布的拒绝域,则可以拒绝原假设,接受备择假设。
    检验规则有两种:
    (1)临界值规则。将检验统计量的值(t,z)与显著性水平的临界值进行对比,得出是否拒绝原假设。
    (2)P—值规则。指将检验统计量对应的概率p与显著性水平进行对比,得出是否拒绝原假设。
  4. 一般也可以由结果得出置信区间。

两类错误

第一类错误

指原假设事实上为真,但却拒绝原假设的错误,也叫弃真错误, σ \sigma σ错误。

第二类错误

指原假设事实上为假,但却接受原假设的错误,也叫取伪错误, β \beta β错误。
人们总希望 σ \sigma σ, β \beta β越小越好,但当样本容量一定时,一类错误几率减小,另一类错误几率便增大。若要使两类错误概率都减小,只能增加样本容量。

两个样本均值之差的方差

μ x + y = μ x + μ y \mu_{x+y} = \mu_x + \mu_y μx+y=μx+μy μ x − y = μ x − μ y \mu_{x-y} = \mu_x - \mu_y μxy=μxμy

σ x + y 2 = σ x 2 + σ y 2 \sigma_{x+y}^2 = \sigma_x^2 + \sigma_y^2 σx+y2=σx2+σy2,

σ x − y 2 = σ x 2 + σ y 2 \sigma_{x-y}^2 = \sigma_x^2 + \sigma_y^2 σxy2=σx2+σy2.
注意区别,具体推导日后再补。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值