Datawhale打卡-统计学(day3)

假设检验(一)

一,定义

假设检验是一种判断某个事件发生的可能性时使用的科学方法,首先先提出一个假设,也就是原假设 H 0 H_{0} H0,然后还有一种是备择假设 H 1 H_{1} H1或者 H a H_{a} Ha,

假设检验是趋于保守的原则的,也就是原假设是保守的假设;
原假设与备择假设不一定是对立的,但一定是互斥的;

二,判断是否拒绝原假设
  • p值法
    p值主要用来判断不同样本之间差距是由抽样误差引起的还是总体不同引起的,p值越小说明反对原假设的证据越多,若p值<a,则拒绝 H 0 H_{0} H0
  • 临界值法
    临界值是我们用来拒绝原假设的检验统计量的最大值,若z<-z_α,则拒绝 H 0 H_{0} H0,其中-z_α为临界值,也是标准正太概率分布下侧面积为α时对应的z值
三,单侧假设与双侧假设

单侧假设是考虑方向性,只考虑正向或者负向作用;而双侧假设是检测样本平均数和总体平均值有无明显差异,不需要考虑差异方向

假设检验(二)

一,Z-统计量和t-统计量
  • Z-统计量
    样本数量足够大(z>30),样本抽样的均值分布服从正态分布,可使用z-分数表
  • t-统计量
    样本足够小时(z<30),样本抽样的均值分布服从t分布,可使用t分布表
二 ,两类错误
H 0 H_{0} H0 为真 H 0 H_{0} H0为假
接受原假设Ⅱ型错误
拒绝原假设Ⅰ型错误显著水平α
三,随机变量之差的方差

E(X)=E(X-Y)=E(X)-E(Y)
D(Z)=D(X)+D(Y)

四,样本均值之差的分布

样本均值的抽样分布的标准差为 σ X σ_X σX/ n \sqrt{n } n ,其中样本均值差的置信区间是利用样本均值差的分布对样本均值差进行区间估计

五, 均值之差的假设检验

与单变量均值的假设检验,仅在构造统计量时产生差异

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值