原假设“截距为0”双侧检验P值是多少_假设检验——这一篇文章就够了

我们为什么要假设检验

我们在生活中经常会遇到对一个总体数据进行评估的问题,但我们又不能直接统计全部数据,这时就需要从总体中抽出一部分样本,用样本来估计总体情况。

举一个简单的例子:

学而思网校App进行了改版迭代,现在有以下两个版本

版本1:首页为一屏课程列表 ; 版本2:首页为信息流

如果我们想区分两个版本,哪个版本用户更喜欢,转化率会更高。我们就需要对总体(全部用户)进行评估,但是 并不是全部存量用户都会访问App,并且每天还会新增很多用户,所以我们无法对总体(全部用户)进行评估,我们只能从总体的用户中随机抽取样本(访问App)的用户进行分析,用样本数据表现情况来充当总体数据表现情况,以此来评估哪个版本转化率更高。

斑马:AB测试从应用到系统搭建​zhuanlan.zhihu.com
eca5a7ea72961e24626ef1df5232bdc2.png

假设检验定义

假设检验是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立

假设检验的假设

由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。

所以做假设检验时会设置两个假设:

一种叫原假设,也叫零假设,用H0表示。原假设一般是统计者想要拒绝的假设。原假设的设置一般为:等于=、大于等于>=、小于等于<=。

另外一种叫备择假设,用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为:不等于、大于>、小于<。

例子在进行假设检验时,我们希望接受版本2的假设,想拒绝接受版本1的假设。所以我们的假设设置为:H0 :μ版本1 >= μ版本2 ,H1 : μ版本1 < μ版本2。

为什么统计者想要拒绝的假设放在原假设呢?因为原假设备被拒绝如果出错的话,只能犯第I类错误,而犯第I类错误的概率已经被规定的显著性水平所控制。有点看不懂哈?没关系我们讲一下假设检验中的两种错误和显著性水平就清楚了。

弃真错误、取伪错误

我们通过样本数据来判断总体参数的假设是否成立,但样本时随机的,因而有可能出现小概率的错误。这种错误分两种,一种是弃真错误,另一种是取伪错误。

弃真错误也叫第I类错误或α错误:它是指 原假设实际上是真的,但通过样本估计总体后,拒绝了原假设。明显这是错误的,我们拒绝了真实的原假设,所以叫弃真错误,这个错误的概率我们记为α。这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小。

取伪错误也叫第II类错误或β错误:它是指 原假设实际上假的,但通过样本估计总体后,接受了原假设。明显者是错误的,我们接受的原假设实际上是假的,所以叫取伪错误,这个错误的概率我们记为β。

现在清楚原假设一般都是想要拒绝的假设了么?因为原假设备被拒绝,如果出错的话,只能犯弃真错误,而犯弃真错误的概率已经被规定的显著性水平所控制了。这样对统计者来说更容易控制,将错误影响降到最小。

显著性水平

显著性水平是指当原假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率。这个值是我们做假设检验之前统计者根据业务情况定好的。

显著性水平α越小,犯第I类错误的概率自然越小,一般取值:0.01、0.05、0.1等

当给定了检验的显著水平a=0.05时,进行双侧检验的Z值为1.96,t值为 。

当给定了检验的显著水平a=0.01时,进行双侧检验的Z值为2.58 。

当给定了检验的显著水平a=0.05时,进行单侧检验的Z值为1.645 。

当给定了检验的显著水平a=0.01时,进行单侧检验的Z值为2.33

检验方式

检验方式分为两种:双侧检验和单侧检验。单侧检验又分为两种:左侧检验和右侧检验。

双侧检验:备择假设没有特定的方向性,形式为“≠”这种检验假设称为双侧检验

单侧检验:备择假设带有特定的方向性 形式为">""<"的假设检验,称为单侧检验 "<"称为左侧检验 ">"称为右侧检验

检验统计量

定义:据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。

拒绝域

定义:拒绝域是由显著性水平围成的区域

拒绝域的功能主要用来判断假设检验是否拒绝原假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝原假设,否则不拒绝原假设。给定显著性水平α后,查表就可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。

双侧检验拒绝域:

265b3161e9cc15eb8ab53c81b86154fc.png

左侧检验拒绝域:

9aa3682041525747256413e5dc63c7e5.png

右侧检验拒绝域:

facd40a95317429ae3980a1370d6adf8.png

假设检验步骤

  • 提出原假设与备择假设
  • 从所研究总体中出抽取一个随机样本
  • 构造检验统计量
  • 根据显著性水平确定拒绝域临界值
  • 计算检验统计量与临界值进行比较

两种假设检验

假设检验根据业务数据分为两种:一个总体参数的假设检验和两个总体参数的假设检验

一个总体参数的假设检验:只有一个总体的假设检验

举个例子:学而思App原版本1转化率为 19%,学而思App版本2开发完成后,直接全量发布整体上线,过一段时间后统计转化率为27%,我们想判断版本2是否比版本1好,这时我们做的假设检验总体只有1个,全部用户。对于总体只有一个的称为一个总体参数的假设检验。

两个总体参数的假设检验:有两个总体的假设检验

同样的例子:学而思App版本1和学而思App版本2同时上线,流量各50%,这时我们做的假设检验总体有2个,分别为命中版本1的全部用户与命中版本2的全部用户。

两种假设检验的检验统计量计算方式有所不同,所以做区分描述。

一个总体参数的假设检验:

大小样本:样本量大于等于30的样本称为大样本,样本量小于30的样本称为小样本。

一个总体参数的样本(n

)假设检验方法:

假设形式:

双侧检验:H0 :

, H1 :

左侧检验:H0:

, H1 :
;

右侧检验:H0:

, H1 :
;

检验统计量:

:当总体标准差已知时,用
参与计算更精准。

双侧检验:

左侧检验:

右侧检验:

P值决策:

P<

,拒绝H0

cd82437ac0a7c67787ca964042a7d537.png

0e2c888520bab63b4b0ff8e2c46054e7.png

一个总体参数的小样本(n<30)假设检验方法:

假设形式:

双侧检验:H0 :

, H1 :

左侧检验:H0:

, H1 :
;

右侧检验:H0:

, H1 :
;

检验统计量:

:当总体标准差已知时,用
参与计算更精准。

双侧检验:

左侧检验:

右侧检验:

t值怎么看:

是样本量=10、自由度=n-1。当α=0.05时,临界值-双侧检验:t0.025(9) 单侧检验t0.05(9)

P值决策:

P<

,拒绝H0

afbfa95f249507270d8871c165c76ba1.png

b968454c01486620b75470c953fbd093.png

一个总体成数的假设检验

定义:

样本成数:它是指样本中具有某一相同标志表现的单位数占样本容量的比重,记为p.

总体成数:它是指总体中具有某一相同标志表现的单位数占全部总体单位数的比重,一般用π表示.

假设形式:

双侧检验:

左侧检验:

右侧检验:

检验统计量:

样本成数

总体成数

与拒绝域:

双侧检验:

左侧检验:

右侧检验:

P值决策:

P<

,拒绝H0

4c164d59185c100aaf2b69b9c913b84b.png

两个总体参数的假设检验

大小样本:样本量大于等于30的样本称为大样本,样本量小于30的样本称为小样本。

两个总体参数的样本(n

)假设检验方法:

假设形式:

双侧检验:

左侧检验:

右侧检验:

检验统计量

两个样本均值

:当总体标准差已知时,用
参与计算更精准。

双侧检验:

左侧检验:

右侧检验:

P值决策:

P<

,拒绝H0

c41b010a2d82125ae9105c0f4aad1735.png

两个总体成数的假设检验

当n1*P1、n1*(1-P1)、n2*P2、n2*(1-p2)都大于或等于5时,就可以称为大样本。

假设形式:

双侧检验:H0 : π1-π2 =0 ,H1 : π1-π2≠0

左侧检验:H0 : π1-π2 ≥0 ,H1 : π1-π2<0

右侧检验:H0 : π1-π2 ≤0 ,H1 : π1-π2>0

检验统计量:

(1)原假设为

或 π1-π2 ≥0 、π1-π2 ≤0情况下。

检验统计量:

(2)原假设为

检验统计量:

双侧检验:

左侧检验:

右侧检验:

P值决策:

P<

,拒绝H0

545e2e2fe982b594692cd19ba57daf15.png

R语言实现假设检验

z.test():BSDA包,调用格式

z.test(x, y = NULL, alternative = "two.sided,less,right", mu = 0, sigma.x = NULL, sigma.y = NULL, conf.level = 0.95)

x,y为样本数据,单样本时忽略y;alternative选择检验类型,two.sided 双侧检验,less左侧检验,greater右侧检验 ;mu为原假设的均值;sigma.x,sigma.y为标准差;conf.level为置信水平,var.equal是逻辑变量,var.equal=TRUE表示两样品方差相同,var.equal=FALSE(缺省)表示两样本方差不同

t.test():调用格式

t.test(x, y = NULL, alternative=c("two sided","less","greater"), mu = 0,paired = TRUE, var.equal = FALSE, conf.level = 0.95,...)

x,y为样本数据,单样本时忽略y;alternative选择检验类型,two.sided 双侧检验,less左侧检验,greater右侧检验 ;mu为原假设的均值;sigma.x,sigma.y为标准差;conf.level为置信水平,var.equal是逻辑变量,var.equal=TRUE表示两样品方差相同,var.equal=FALSE(缺省)表示两样本方差不同

binom.test():调用格式

binom.test(x, n, p = 0.5,alternative = c("two.sided", "less", "greater"),conf.level = 0.95)

其中x是成功的次数;n是试验总数,P是原假设的概率。也是总体成数的公式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用统计学中的t检验和F检验来对一元线性回归模型进行检验。使用Python中的statsmodels库进行回归分析和模型诊断,可以方便地进行模型的检验。 示例代码如下: ```python import numpy as np import statsmodels.api as sm # 构造模拟数据 x = np.array([1, 2, 3, 4, 5]) y = np.array([2, 4, 5, 4, 6]) # 对数据进行一元线性回归分析,包括模型拟合、模型诊断 X = sm.add_constant(x) # 加入截距项 model = sm.OLS(y, X).fit() # 模型拟合 print(model.summary()) # 输出模型诊断结果 # 进行回归模型的检验 # t检验 t_value = model.tvalues[1] # 提取 x 系数的 t p_value = model.pvalues[1] # 提取 x 系数的 p print('t 为:', t_value) print('p 为:', p_value) if p_value < 0.05: # 假设显著性水平为 0.05 print('在显著性水平为 0.05 下,x 系数的 t 检验拒绝假设,即 x 对 y 的回归系数不为 0。') else: print('在显著性水平为 0.05 下,x 系数的 t 检验接受假设,即 x 对 y 的回归系数为 0。') # F检验 f_value = model.fvalue # 提取 F 统计量 f_pvalue = model.f_pvalue # 提取 F 统计量的 p print('F 统计量为:', f_value) print('F 统计量的 p 为:', f_pvalue) if f_pvalue < 0.05: # 假设显著性水平为 0.05 print('在显著性水平为 0.05 下,回归模型的 F 检验拒绝假设,即模型对因变量的解释程度是显著的。') else: print('在显著性水平为 0.05 下,回归模型的 F 检验接受假设,即模型对因变量的解释程度不显著。') ``` 注意:以上代码仅供参考,实际应用时需结合具体情况进行修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值