双侧检验的p值和单侧检验_参数检验

03ff43a53454acf8be57f7691be9dc7c.png

检验分为参数检验和非参数检验。参数检验假定数据可以由一个或多个参数定义的分布很好地描述,在大多数情况下是通过正态分布来描述的。对于给定的数据集,需要确定并解释该分布的最佳拟合参数和它们的置信区间。但是只有给定的数据集和被选择的分布近似的时候才能正常工作,否则就要用非参数检验就是因为它不依赖服从特定的分布。

所以在参数检验之前,需要做正态性检验。

一、正态性检验

因为在假设检验过程中有很多场景需要判断总体是否服从正态分布,所以要在实验前先判断总体的分布情况,判断总体是否是正态分布的方法有如下几种:

(1)概率图

  • QQ图 Q指的是quantile(分位数),将给定数据集的分位数和参考分布的分位数一起绘制
  • PP图 将guessing数据集的CDF和参考分布的CDF一起绘制
  • 概率图 绘制了给定数据集的有序数值和参考分布的分位数

(2)常见分布

  • 基于和给定分布比较最佳拟合的检验 常根据CDF来确定
  • 基于样本的描述性统计学的检验 如偏度检验、峰度检验等

二、假设检验

假设检验是在统计学中非常重要的知识点,也是各大面试中的高频考点,而且在工作中最常用到的一个场景ABtest,也是高频点,接下来就捋一下那些年我们一起学过的假设检验...

假设检验的思想就是小概率事件,是先对未知总体参数进行一个假设,然后再用样本信息对这个假设是否成立进行验证。在工作场景中最常见的应用就是ABtest。假设检验就是首先对参数提出一个假设,然后用样本信息去检验这个假设是否成立。

(1)第一类错误和第二类错误

第一类错误是弃真错误alpha,也就是在原假设是真的前提下被拒绝的概率,在工作中也就是AB两种方案没有差别,但却认为两者有差别而导致错误上线的情况,又叫做显著性水平,是由人们根据检验的要求确定的,一般是0.05或者0.01,也就是当做出接受原假设的决定时,正确的概率是95%或者99%,是从我们能接受的精确度来出发的,根据边界来看是落入接受域还是拒绝域。在参数估计中,alpha表示风险值,是总体均值不包括在置信区间内的概率,其实就是原假设为真的时候落入拒绝域的概率,1-alpha是置信水平,其实也就是

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值