相关名词:弃真错误、取伪错误 ,原假设、备择假设,双侧检验、左侧检验、右侧检验,统计量:Z统计量、T统计量,拒绝域、接受域,显著水平
背景:
一般假设检验用在实际工作中是在做AB实验时,用于确定一个新的策略、产品是否优于之前,因为对比新旧策略不可能把所有的目标用户都计算一下相关指标,比较优劣。一般是进行抽样,保证各方面条件一致的情况下,二者差异的地方只有策略不同。
举个例子,我想要对比新旧策略A、B的效果,一般会有2种假设:
原假设:A < B ; 备择假设: A > B
通常会把希望的结果放在备择假设,即新策略优于旧策略,这是因为通过抽样数据来判断假设是否成立,可能会犯弃真错误(也叫第I类错误、错误,这个值也是显著性水平,在假设检验之前我们会规定这个概率的大小)或取伪错误(第II类错误、
错误),弃真错误的概率会被限制,一般是0.05,此时错误的概率值是可控的,因此一般会把想要拒绝的假设放在原假设。
显著水平:是指当原假设实际上正确时,检验统计量落在拒绝域的概率,简单理解就是犯弃真错误的概率
检验方式:
检验方式分为两种:双侧检验和单侧检验,单侧检验又分为两种:左侧检验和右侧检验。
双侧检验:备择假设没有特定的方向性,形式为“≠”这种检验假设称为双侧检验。
单侧检验:备择假设带有特定的方向性 形式为">""<"的假设检验,称为单侧检验, "<"称为左侧检验, ">"称为右侧检验。
检验统计量:据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。
拒绝域:由显著性水平围成的区域
拒绝域的功能主要用来判断假设检验是否拒绝原假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝原假设,否则不拒绝原假设。给定显著性水平α后,查表就可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。
假设检验步骤
- 提出原假设与备择假设
- 从所研究总体中出抽取一个随机样本
- 构造检验统计量
- 根据显著性水平确定拒绝域临界值
- 计算检验统计量与临界值进行比较
两种假设检验
假设检验根据业务数据分为两种:一个总体参数的假设检验和两个总体参数的假设检验
一个总体参数的假设检验时A>0.5这种,两个总体参数是A>B这种
统计量的选择
一般当样本量大于30时,称为大样本,根据中心极限定理,样本的分布趋于正态分布
参考资料: