概率统计Python计算：用样本均值和方差计算总体参数的点估计

戌崂石

已于 2024-05-22 10:06:27 修改

阅读量2.5k

点赞数 2

分类专栏：概率统计文章标签：概率论

于 2021-05-15 16:59:29 首次发布

本文链接：https://blog.csdn.net/u012958850/article/details/116853551

版权

概率统计专栏收录该内容

76 篇文章 29 订阅

订阅专栏

在这里插入图片描述
设来自总体 $X$ 的简单样本为 $(X_1, X_2,\cdots,X_n)$ 。样本均值为 $\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i$ ，样本方差为 $S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2$ 。用Python的numpy包提供的array对象表示样本观测值 $(x_1,x_2,\cdots,x_n)$ ，则运用array对象的mean方法可算得样本均值的观测值 $\overline{x}=\frac{1}{n}\sum\limits_{i=1}^nx_i$ ，这是一个无参函数。用array对象的var方法可算得样本方差的观测值 $s^2=\frac{1}{n-1}\sum\limits_{i=1}^n(x_i-\overline{x})^2$ ，其调用接口为
$\text{var(ddof=0)}$
参数ddof确定算得的结果为 $\frac{1}{n-\text{ddof}}\sum\limits_{i=1}^n(x_i-\overline{x})^2$ ，缺省值为0，即计算样本2阶原点矩 $\frac{1}{n}\sum\limits_{i=1}^n(x_i-\overline{x})^2$ 。即传递1给ddof，则var算得 $s^2$ 。
利用array的std方法则可计算 $(x_1,x_2,\cdots,x_n)$ 的标准差，其调用接口为
$\text{std(ddof=0)}$
参数ddof的意义与var的同名参数相同。即传递1给ddof，std算得 $s=\sqrt{s^2}$ 。
例1 设总体 $X$ 的样本观测值为1502，1453，1367，1650，求样本均值，样本方差和样本均方差。
解：样本均值为 $\overline{x}=\frac{1}{4}(1502+1453+1376+1650)=1493.$ 样本方差为 $s^2=\frac{1}{3}[(1502-1493)^2+(1453-1493)^2+(1376-1493)^2+(1650-1493)^2]=14068.667.$ 样本均方差为 $s=\sqrt{s^2}=\sqrt{14068.667}=118.611.$
下列代码验算本例计算结果。

import numpy as np                      #导入numpy
x=np.array([1502, 1453, 1367, 1650])    #设置样本数据
mean=x.mean()                           #计算样本均值
s2=x.var(ddof=1)                        #计算样本方差
s=x.std(ddof=1)                         #计算样本均方差
print('x_=%.4f'%mean)
print('s^2=%.4f'%s2)
print('s=%.4f'%s)

第3行调用array对象x的mean方法，计算样本均值 $\overline{x}$ ，第4，5行分别调用x的var方法和std方法计算样本方差 $s^2$ 和样本均方差 $s$ 。运行程序，输出

x_=1493.0000
s^2=14068.6667
s=118.6114

由于 $\overline{X}$ 和 $S^2$ 是总体均值 $\mu$ 和总体方差 $\sigma^2$ 的无偏估计，故可运用array对象的上述方法来计算 $\mu$ 和 $\sigma^2$ 的点估计值，然后直接或间接地计算总体的未知参数估计值。
例2 设总体 $X$ ~ $U (a, b)$ ， $a$ 和 $b$ 未知。 $(X_1,X_2,\cdots,X_n)$ 为来自 $X$ 的样本，用样本均值 $\overline{X}$ 和样本方差 $S^2$ 计算 $a$ ， $b$ 的估计量。设容量 $n = 20$ 的样本观测值为
$1.248,1.664,1.101,1.967,1.468,1.140,1.434,1.063,1.878,1.375\\ 1.819,1.704,1.328,1.619,1.830,1.764,1.034,1.553,1.878,1.166$
计算 $a$ ， $b$ 的估计值。
解：我们知道 $E(X)=\frac{a+b}{2}$ ， $D(X)=\frac{(b-a)^2}{12}$ 。用样本均值 $\overline{X}=\frac{1}{n}\sum\limits_{i=1}^{n}X_i$ 和样本方差 $S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2$ ，分别估计 $E (X)$ 和 $D (X)$ 。即
$\begin{cases} \frac{\stackrel{\wedge}{a}+\stackrel{\wedge}{b}}{2}=\overline{X}\\\frac{(\stackrel{\wedge}{b}-\stackrel{\wedge}{a})^2}{12}=S^2 \end{cases}$
解此方程组，得参数 $a$ 与 $b$ 的估计量
$\begin{cases}\stackrel{\wedge}{a}=\overline{X}-\sqrt{3}S\\\stackrel{\wedge}{b}=\overline{X}+\sqrt{3}S\end{cases}$
其中， $S=\sqrt{S^2}$ 为样本标准差。
样本均值的观测值为
$\overline{x}=\frac{1}{20}(1.248+1.664+\cdots+1.166)=1.502$
样本方差的观测值为
$s^2=\frac{1}{19}[(1.248-1.502)^2+(1.664-1.501)^+\cdots+(1.166-1.502)^]=0.094$
样本均方差 $s=\sqrt{s^2}=0.307$ ，代入 $a$ ， $b$ 估计量表达式
$\begin{cases}\stackrel{\wedge}{a}=\overline{x}-\sqrt{3}s=0.970\\\stackrel{\wedge}{b}=\overline{x}+\sqrt{3}s=2.034\end{cases}.$
下列代码验算本例计算结果。

import numpy as np                              #导入numpy
x=np.array([1.248, 1.664 ,1.101 ,1.967 ,1.468,  #设置样本数据数组
            1.140, 1.434, 1.063, 1.878, 1.375,
            1.819, 1.704, 1.328, 1.619, 1.830,
            1.764, 1.034, 1.553, 1.878, 1.166])
mu=x.mean()                                     #计算样本均值
sigma=x.std(ddof=1)                             #计算样本标准差
a=mu-np.sqrt(3)*sigma                           #计算参数a的估计值
b=mu+np.sqrt(3)*sigma                           #计算参数b的估计值
print('用样本均值、方差估计a=%.4f, b=%.4f'%(a, b))

运行程序，输出

用样本均值、方差估计a=0.9697, b=2.0336

写博不易，敬请支持：
如果阅读本文于您有所获，敬请点赞、评论、收藏，谢谢大家的支持！
代码诚可贵，原理价更高。若为AI学，读正版书好。
返回《导引》

戌崂石

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
概率统计Python计算：用样本均值和方差计算总体参数的点估计

设来自总体XXX的简单样本为(X1,X2,⋯ ,Xn)(X_1, X_2,\cdots,X_n)(X1,X2,⋯,Xn)。样本均值为X‾=1n∑i=1nXi\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_iX=n1i=1∑nXi，样本方差为S2=1n−1∑i=1n(Xi−X‾)2S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2S2=n−11i=1∑n(Xi−X)2。用Python的nu
复制链接

扫一扫