假设检验

最新推荐文章于 2021-02-11 10:23:52 发布

火鸡哥

最新推荐文章于 2021-02-11 10:23:52 发布

阅读量544

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/u012587024/article/details/79881430

版权

机器学习专栏收录该内容

33 篇文章 1 订阅

订阅专栏

假设检验

我们先下来理解一下标准差和标准误差的概念。
标准差是表示个体间变异大小的指标，反映了整个样本对样本增平均数离散程度，是数据精密度的衡量指标。
标准误差反映样本平均数对总体平均数的变异程度，从而反映抽样误差的大小，是量度结果精密度的指标。样本越大，标准误差就越小，样本均值与总体均值也就越接近，使用se表示。

标准差： $\sqrt{\frac{\sum_{(x_i-\overline x)^2}}{n}}$
标准误差： $\frac{σ}{\sqrt{n}}$
样本标准差： $\sqrt{\frac{\sum_{(x_i-\overline x)^2}}{n-1}}$

注意：样本标准差跟样本的标准差是不一样的概念，不要混淆了，我们可以使用样本标准差来估算总体的标准差，一般地，我们可以认为样本标准差约等于总体的标准差，即 $s d \approx σ$ 。

一、 z检验

已知：
实验前的总体均值 $\mu$ 和标准差 $σ$
实验后的样本均值 $\overline x$ 和样本数 $n$

问题：
实验前后均值差异是否显著？(实验是否有效果？)

解决方案：
我们已经有了两组数据(如上)，为了比较这两组数据的差异性，我们必须假设两组数据的分布是一样的，因此我们必须有一个假设，这个假设称为零假设 $H_0:$ 实验前后均值差异不显著。
这个零假设让我们可以通过实验前的总体数据计算理想状态下样本(跟实验后样本量一样)的数据：
中心极限定理认为总体均值和样本均值是一样的，所以理想状态下的样本均值： $\overline \mu = \mu$
这里要求理想状态下的样本标准误差误差，所以样本标准误差应该由总体标准差得到： $\frac{σ}{\sqrt{n}}$
接下来，我们要比较一下实验后的样本均值跟理想状态下的均值的误差，我们不能直接使用它们的差当作误差，因为数据的分布不一样，差能表达的误差大小就不一样，所以我们应该将它们的差与标准误差的比来衡量均值的误差大小：
$Z_{统计量}=\frac{\overline x - \mu}{se}$
这个值我们称为Z统计量。
然后，我们还需要确定我们能接受的误差范围（确定 $\alpha$ 值），如果误差超出了这个范围，我们就认为样本均值跟总体均值差别太大，拒绝零假设，否则接受零假设。
判断误差是否在误差范围内有两种方式：第一种是根据 $\alpha$ 水平找出 $Z_{临界值}$ ，然后判断 $Z_统计量$ 是否超出 $Z_{临界值}$ ，若超出就拒绝零假设。第二种是找出总体均值置信区间(这里可以找总体均值的置信区间，也可以找样本均值的置信区间)： $(\overline x - Z_临*sd,\overline x + Z_临*sd)$ ，然后判断总体均值是否在置信区间内，若不在置信区间内就拒绝零假设。

附上Z表格：
https://s3.amazonaws.com/udacity-hosted-downloads/ZTable.jpg

缺点：
上面是通过总体，计算在理想状态下的样本数据，但大多情况下抽样都不会理想的，所以Z检验存在抽样误差。

二、单样本t检验

已知：
样本集
总体均值 $\mu_0$
检验：
样本集均值与总体均值 $\mu_0$ 差异的显著性

解决方案：
这种情况，我们不知道总体的标准差，所以不能通过总体的标准差来求理想情况下样本的标准误差，但是我们可以计算出样本的理想总体。同样，我们需要定义零假设 $H_0：$ 样本集均值与总体均值 $\mu_0$ 差异不显著。
贝塞尔校正认为，对n个样本进行抽样，其自由度为 $d f = n - 1$ ,所以样本所有的理想总体的标准差为：
$σ≈sd=\sqrt{\frac{\sum(x_i-\overline x)^2}{df}}$
该总体是理想情况下的，所以也会有总体的标准误差：
$se=\frac{σ}{\sqrt{n}}$
到这里，好像我们可以直接使用Z检验了，但是Z检验的总体方差是真实数据得到的，而这里的总体方差是通过样本计算出来的，二者的总体方差的设定不同，所以这里不能使用Z检验，这里要使用T检验。
先计算出t统计量：
$t_{统计量}=\frac{\overline x-\mu_0}{se}$
然后根据 $\alpha$ 水平、自由度df计算出 $t_{临界值}$ ，最后的判断跟Z检验一样。
置信区间： $(\overline x-t_{临界值}*se,\overline x+t_{临界值}*se)$

附上T表格：
https://s3.amazonaws.com/udacity-hosted-downloads/t-table.jpg

标准化差异度量：
$\frac{\overline x - \mu_0}{S}$

三、相依样本t检验

两个样本相互影响，成对出现。
特征：
1､对照实验组
2､先验测试，后验测试
3､随着时间推移的增长情况（纵向研究）

已知：
两个相依样本集

检验：
两个样本集的均值差异的显著性

解决方案：
要对比相依样本集的均值差异的显著性，只要对比两个样本差集的均值与0的显著性就行了，求出差集之后，就是单样本t检验了。

不足：
1､残留效应，相依样本可能会有残留效应，也就是第二次的试验结果可能受到了第一次试验的影响。

误差范围：
$t_{临界值}*se$

四、独立样本t检验

独立样本的两个样本集的样本数可能不相等，所以这里要使用合并方差平方和( $SP^2$ )为总体的标准差，使用合并方差平方和( $SP^2$ )的条件：
1､X、Y样本集来自两个独立总体的随机样本
2､两个总体应该大概是正态的
3､样本数据可以用来估计总体方差
4､两个样本的总体方差大概相等

若认为两个样本集的样本数大致相等，可使用以下公式计算样本均值的标准误差：
$\sqrt{\frac{S_x^2}{n_x}+\frac{S_y^2}{n_y}}$

已知：
两个独立样本集

检验：
两个样本集的均值差异的显著性

解决方案：
这两个数据集所在总体分布可能不一样，所以不能使用上面的方法进行验证。我们可以假设这两个数据集的总体是在一个更大的总体上，这个更大的总体就是两个数据集所在的总体的集合，那么这两个数据集就是在更大的总体上的两块抽样了。公式如下。

步骤：
1､作出假设，定义零假设、对立假设和拒绝域
2､计算两个样本集的差的平方和
$SS_x = \sum_{i=1}^{n}(x_i-\overline x)^2$
$SS_y = \sum_{i=1}^{n}(y_i-\overline y)^2$
3､计算总体的合并方差平方和
$SP^2=\frac{SS_x+SS_y}{df},(df=df_x+df_y)$
4､计算均值的校正标准误差
$SE=\sqrt{\frac{SP^2}{n_x}+\frac{SP^2}{n_y}}$
5､计算t统计量
$t_{统计量}=\frac{\overline x - \overline y}{SE}$
6､根据 $\mu$ 水平、自由度df计算出 $t_{临界值}$
7､作出决策