七、假设检验：使用Python进行两个正态总体方差的假设检验

hflag168

已于 2023-05-28 22:53:38 修改

阅读量1.5k

点赞数

分类专栏：统计假设检验文章标签：概率论

于 2020-07-03 20:07:10 首次发布

本文链接：https://blog.csdn.net/qq_35125180/article/details/107114095

版权

统计同时被 2 个专栏收录

15 篇文章 9 订阅

订阅专栏

假设检验

11 篇文章 2 订阅

订阅专栏

假设两个正态总体 $X\sim N(\mu_1, \sigma_1^2)， Y\sim N(\mu_2, \sigma_2^2)$ . $X_1,...,X_{n_1}$ 和 $Y_1,...,Y_{n_2}$ 是分别来自这两个正态总体的样本，并且这两个样本相互独立。
记 $\overline X, \overline Y, S_1^2, S_2^2$ 分别为两样本的均值和方差。假设 $\mu_1, \mu_2$ 未知，显著水平为 $\alpha$ 。
检验统计量：
$\frac{S_1^2}{S_2^2}\sim F(n_1-1, n_2-1)$

双边检验

假设检验形式：
$H_0: \sigma_1^2 = \sigma_2^2 \quad \sigma_1^2 \neq \sigma_2^2$
拒绝域为：
$\frac{S_1^2}{S_2^2}\le F_{1-\alpha/2}(n_1-1,n_2-1)\quad or\quad F=\frac{S_1^2}{S_2^2}\ge F_{\alpha/2}(n_1-1,n_2-1)$
p值求法：
$2min\{P(F\ge f_0), P(F\le f_0) \}$

左侧检验

假设检验形式：
$H_0: \sigma_1^2 = \sigma_2^2 \quad \sigma_1^2 \lt \sigma_2^2$
拒绝域为：
$F=\frac{S_1^2}{S_2^2}\le F_{1-\alpha}(n_1-1,n_2-1)$
p值求法：
$P(F\le f_0)$

右侧检验

假设检验形式：
$H_0: \sigma_1^2 = \sigma_2^2 \quad \sigma_1^2 \gt \sigma_2^2$
拒绝域为：
$F=\frac{S_1^2}{S_2^2}\ge F_\alpha(n_1-1,n_2-1)$
p值求法：
$P(F\ge f_0)$

Python计算代码

import numpy as np
from scipy import stats

def ftest(data1, data2, side='both'):
    n1=len(data1)
    n2=len(data2)
    F = stats.f(dfn=n1-1, dfd=n2-1)
    tmp = np.var(data1, ddof=1)/np.var(data2, ddof=1)
    ret_left = F.cdf(tmp)
    ret_right = F.sf(tmp)
    if side=='both':
        return 2*min(ret_left, ret_right)
    elif side=='left':
        return ret_left
    return ret_right

实例

例1：两台机床生产同一个型号的滚珠，从甲机床生产的滚珠中抽取8个，从乙机床生产的滚珠中抽，从乙机床生产的滚珠中抽取9 个，测得这些滚珠的直径( 毫米) 如下:
• 甲机床 15.0 14.8 15.2 15.4 14.9 15.1 15.2 14.8
• 乙机床 15.2 15.0 14.8 15.1 14.6 14.8 15.1 14.5 15.0
设两机床生产的滚珠直径分别为X，Y，且 $X\sim N(\mu_1, \sigma_1^2), Y\sim N(\mu_2, \sigma_2^2)$ .
(1) 检验假设 $H_0: \sigma_1^2 = \sigma_2^2 \quad \sigma_1^2 \neq \sigma_2^2(\alpha=0.1)$
(2) $H_0: \mu_1= \mu_2 \quad \mu_1 \neq \mu_2(\alpha=0.1)$
解：
(1) 根据题意使用方差比值的F双边检验，python计算如下：

data1 = np.array([ 15. ,  14.8,  15.2,  15.4,  14.9,  15.1,  15.2,  14.8])
data2 = np.array([ 15.2,  15. ,  14.8,  15.1,  14.6,  14.8,  15.1,  14.5,  15. ])
ftest(data1, data2, side='right')
# 结果：
pval =  0.77524895976081842

因为 $pval=0.77524895976081842>\alpha=0.1$ ，所以接受原假设。即认为这两台机床生产的滚珠直径方差没有显著的差异。
(2) 该问题可以认为是两个正态总体方差未知但相对的均值估计，可以使用stats.ttest_ind()进行检验

data1 = np.array([ 15. ,  14.8,  15.2,  15.4,  14.9,  15.1,  15.2,  14.8])
data2 = np.array([ 15.2,  15. ,  14.8,  15.1,  14.6,  14.8,  15.1,  14.5,  15. ])
stats.ttest_ind(data1, data2)
# 结果
pvalue=0.19587044237225917