ABtest与假设检验（一）

最新推荐文章于 2024-05-20 16:07:41 发布

哈皮狗的忧桑

最新推荐文章于 2024-05-20 16:07:41 发布

阅读量60

点赞数

文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/weixin_51725180/article/details/132261100

版权

假设检验的定义：

假设检验是先对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立

假设检验的假设：

由定义可知，我们需要对结果进行假设，然后拿样本数据去验证这个假设。

所以做假设检验时会设置两个假设：

一种叫原假设，也叫零假设，用H0表示。原假设一般是统计者想要推翻的假设。原假设的设置一般为：等于=、大于等于>=、小于等于<=。

另外一种叫备择假设，用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为：不等于、大于>、小于<。

例子在进行假设检验时，我们希望接受版本2的假设，想拒绝接受版本1的假设。所以我们的假设设置为：H0 ：μ版本1 >= μ版本2 ，H1 : μ版本1 < μ版本2。

为什么统计者想要拒绝的假设放在原假设呢？因为原假设备被拒绝如果出错的话，只能犯第I类错误，而犯第I类错误的概率已经被规定的显著性水平所控制。有点看不懂哈？没关系我们讲一下假设检验中的两种错误和显著性水平就清楚了。

弃真错误、取伪错误

我们通过样本数据来判断总体参数的假设是否成立，但样本时随机的，因而有可能出现小概率的错误。这种错误分两种，一种是弃真错误，另一种是取伪错误。

弃真错误也叫第I类错误或α错误：它是指原假设实际上是真的，但通过样本估计总体后，拒绝了原假设。明显这是错误的，我们拒绝了真实的原假设，所以叫弃真错误，这个错误的概率我们记为α。这个值也是显著性水平，在假设检验之前我们会规定这个概率的大小。

取伪错误也叫第II类错误或β错误：它是指原假设实际上假的，但通过样本估计总体后，接受了原假设。明显者是错误的，我们接受的原假设实际上是假的，所以叫取伪错误，这个错误的概率我们记为β。

现在清楚原假设一般都是想要拒绝的假设了么？因为原假设备被拒绝，如果出错的话，只能犯弃真错误，而犯弃真错误的概率已经被规定的显著性水平所控制了。这样对统计者来说更容易控制，将错误影响降到最小。

构建检验统计量

常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法等。同样地，检验统计量也有Z检验统计量，t检验统计量，χ2检验统计量、F检验统计量。

我们需要根据总体标准差是否已知选择构建的统计量。

Z检验统计量：当总体标准差σ已知时对总体均值进行假设检验，选择标准正态随机变量z作为检验统计量，计算公式为： $z = \frac{\bar{x}-\mu0}{\sigma /\sqrt{n}}$ ，其中 $\bar{x}$ 为样本均值， $\mu _{0}$ 为总体均值，n为样本量。
T检验统计量：当总体标准差σ未知时，检验统计量的抽样分布是t分布。检验统计量服从自由度为n-1的t分布，公式为 $t = \frac{\bar{x}-\mu_{0}}{s/\sqrt{n}}$ ，其中s为样本标准差。

对于T检验的解释：

{

T检验
Z检验虽然能够进行均值差异性检验，但是，它要求总体标准差已知或者样本容量足够大，这是很难做到甚至无法达成的。这时候t检验就粉墨登场了，只需从正态总体中抽取小规模的样本数据，并计算均值与标准差，用来代替正态总体的均值和标准差即可

}

下篇：

中心极限定理
样本量的选择

哈皮狗的忧桑

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
ABtest与假设检验（一）

假设检验是先对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立由定义可知，我们需要对结果进行假设，然后拿样本数据去验证这个假设。所以做假设检验时会设置两个假设：一种叫原假设，也叫零假设，用H0表示。原假设一般是统计者想要推翻的假设。原假设的设置一般为：等于=、大于等于>=、小于等于<=。另外一种叫备择假设，用H1表示。备则假设是统计者想要接受的假设。备择假设的设置一般为：不等于、大于>、小于<。例子在进行假设检验时，我们希望接受版本2的假设，想拒绝接受版本1的假设。
复制链接

扫一扫