概率统计Python计算：单个正态总体均值单侧假设的Z检验

戌崂石

已于 2024-05-22 10:13:26 修改

阅读量2.7k

点赞数 1

分类专栏：概率统计文章标签：概率论

于 2021-05-26 19:28:46 首次发布

本文链接：https://blog.csdn.net/u012958850/article/details/117299080

版权

概率统计专栏收录该内容

76 篇文章 29 订阅

订阅专栏

在这里插入图片描述
对正态总体参数的单侧假设检验，可以用如下的p值法进行。设显著水平为 $\alpha$ ，考虑假设 $H_0$ 的右侧检验。首先，注意到检验统计量的分布对应显著水平 $\alpha$ 的右分位点 $b$ ，实际上就是其残存函数 $S (x)$ （ $= 1 - F (x)$ ）在该点处的函数值 $S (b)$ 恰为 $\alpha$ ，即 $S(a)=\alpha$ 。我们知道在假设 $H_0$ 的右侧检验中， $H_0$ 的拒绝域为 $[b,+\infty)$ 。若检验统计量观测值 $\zeta$ 落在拒绝域内，则必有 $p=S(\zeta)<S(a)=\alpha$ 。而若检验统计量观测值 $\gamma$ 落在非拒绝域内，则应有 $p=S(\gamma)>S(a)=\alpha$ ，如下图所示。
在这里插入图片描述
相仿地，对假设 $H_0$ 的左侧检验而言，设检验统计量的分布对应显著水平 $\alpha$ 的右侧分位点为 $a$ ，则分布函数 $F(a)=\alpha$ 。若检验统计量观测值 $\gamma$ 满足 $p=F(\gamma)>F(a)=\alpha$ ，则 $\gamma$ 落在 $H_0$ 的非拒绝域内，而若检验统计量观测值 $\zeta$ 满足 $p=F(\zeta)<F(a)=\alpha$ ，则 $\zeta$ 落在 $H_0$ 的拒绝域内，如下图所示。
在这里插入图片描述
已知正态总体方差 $\sigma^2$ 的情况下，对总体均值 $\mu$ 作显著水平为 $\alpha$ 的假设检验，采用Z检验法。单侧检验的计算步骤为

1.构造检验统计量观测值 $Z=\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$ ；
2.计算对应于 $Z$ 的累积分布函数值 $p = F (Z)$ （左侧检验）或残存函数值 $p = S (Z)$ （右侧检验）（详见博文《连续型随机变量分布（norm）》）;
3.比较 $p\geq\alpha$ 结果为真，则接受假设，否则拒绝假设。
将此算法编写如下计算总体均值单侧假设检验的Python函数。

from scipy.stats import norm    #导入norm
def ztestL(z, alpha):           #左侧检验函数
    p=norm.cdf(z)               #F(z)
    return p>=alpha             #检验
def ztestR(z, alpha):           #右侧检验函数
    p=norm.sf(z)                #S(z)
    return p>=alpha             #检验

程序的第2~4行定义Z方法左侧检验函数ztestL，第5~7行定义右侧检验函数ztestR。两个函数函数的参数z和alpha分别表示检测统计量观测值 $\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$ 和显著水平 $\alpha$ 。返回的布尔值或为True，则接受假设 $H_0:\mu\geq\mu_0$ （或 $\mu\leq\mu_0$ ），否则拒绝 $H_0$ 。
例1 公司从生产商购买牛奶。公司怀疑生产商在牛奶中掺水以牟利。通过测定牛奶的冰点，可以检验出牛奶是否掺水。天然牛奶的冰点温度近似服从 $N(-0.545,0.008^2)$ ，牛奶掺水可使冰点温度升高而接近于水的冰点温度（ $0^{\circ}$ C）。测得生产商提交的5批牛奶的冰点温度，其均值为 $\overline{x}=-0.535^{\circ}$ C，问是否可以认为生产商在牛奶中掺了水（ $\alpha=0.05$ ）？
解：按题意，需对假设 $H_0:\mu\leq\mu_0=-0.545(H_1:\mu>\mu_0)$ ，即牛奶未掺水进行右侧检验。下列代码完成本例计算。

import numpy as np                              #导入numpy
xmean=-0.535                                    #样本均值
s0=0.008                                        #总体均方差
mu0=-0.545                                      #总体均值假设值
n=5                                             #样本容量
alpha=0.05                                      #显著水平
z=(xmean-mu0)/(s0/np.sqrt(n))                   #检验统计量
accept=ztestR(z, alpha)                         #右侧检验
print('mu<=%.3f is %s.'%(mu0, accept))

第2~6行设置各项数据。第7行计算检验统计量观测值 $\frac{\overline{x}-\mu_0}{\sigma/\sqrt{n}}$ ，第8行调用函数ztestR对假设 $H_0:\mu\leq\mu_0=-0.545$ 作右侧检验。运行程序，输出

mu<=-0.545 is False.

表示拒绝假设 $H_0:\mu\leq\mu_0=-0.545$ ，即拒绝假设：牛奶未掺水。
例2 要求一种元件平均使用寿命不得低于1000h。生产者从一批这种元件中随机抽取25件，测得其寿命的平均值为950h。已知该种元件寿命服从标准差 $\sigma=100$ h的正态分布。试在显著水平 $\alpha=0.05$ 下判断这批元件是否合格。
解：按题意，需要对假设 $H_0:\mu\geq\mu_0=1000$ ，即寿命不低于1000小时进行左侧检验。下列代码完成本例计算。

import numpy as np
xmean=950
sigma=100
mu0=1000
n=25
alpha=0.05
z=(xmean-mu0)/(s0/np.sqrt(n))
accept=ztestL(z, alpha)
print('mu>=%d is %s.'%(mu0, accept))