设来自总体
X
X
X的简单样本为
(
X
1
,
X
2
,
⋯
,
X
n
)
(X_1, X_2,\cdots,X_n)
(X1,X2,⋯,Xn)。样本均值为
X
‾
=
1
n
∑
i
=
1
n
X
i
\overline{X}=\frac{1}{n}\sum\limits_{i=1}^nX_i
X=n1i=1∑nXi,样本方差为
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
‾
)
2
S^2=\frac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{X})^2
S2=n−11i=1∑n(Xi−X)2。用Python的numpy包提供的array对象表示样本观测值
(
x
1
,
x
2
,
⋯
,
x
n
)
(x_1,x_2,\cdots,x_n)
(x1,x2,⋯,xn),则运用array对象的mean方法可算得样本均值的观测值
x
‾
=
1
n
∑
i
=
1
n
x
i
\overline{x}=\frac{1}{n}\sum\limits_{i=1}^nx_i
x=n1i=1∑nxi,这是一个无参函数。用array对象的var方法可算得样本方差的观测值
s
2
=
1
n
−
1
∑
i
=
1
n
(
x
i
−
x
‾
)
2
s^2=\frac{1}{n-1}\sum\limits_{i=1}^n(x_i-\overline{x})^2
s2=n−11i=1∑n(xi−x)2,其调用接口为
var(ddof=0)
\text{var(ddof=0)}
var(ddof=0)
参数ddof确定算得的结果为
1
n
−
ddof
∑
i
=
1
n
(
x
i
−
x
‾
)
2
\frac{1}{n-\text{ddof}}\sum\limits_{i=1}^n(x_i-\overline{x})^2
n−ddof1i=1∑n(xi−x)2,缺省值为0,即计算样本2阶原点矩
1
n
∑
i
=
1
n
(
x
i
−
x
‾
)
2
\frac{1}{n}\sum\limits_{i=1}^n(x_i-\overline{x})^2
n1i=1∑n(xi−x)2。即传递1给ddof,则var算得
s
2
s^2
s2。
利用array的std方法则可计算
(
x
1
,
x
2
,
⋯
,
x
n
)
(x_1,x_2,\cdots,x_n)
(x1,x2,⋯,xn)的标准差,其调用接口为
std(ddof=0)
\text{std(ddof=0)}
std(ddof=0)
参数ddof的意义与var的同名参数相同。即传递1给ddof,std算得
s
=
s
2
s=\sqrt{s^2}
s=s2。
例1 设总体
X
X
X的样本观测值为1502,1453,1367,1650,求样本均值,样本方差和样本均方差。
解:样本均值为
x
‾
=
1
4
(
1502
+
1453
+
1376
+
1650
)
=
1493.
\overline{x}=\frac{1}{4}(1502+1453+1376+1650)=1493.
x=41(1502+1453+1376+1650)=1493.样本方差为
s
2
=
1
3
[
(
1502
−
1493
)
2
+
(
1453
−
1493
)
2
+
(
1376
−
1493
)
2
+
(
1650
−
1493
)
2
]
=
14068.667.
s^2=\frac{1}{3}[(1502-1493)^2+(1453-1493)^2+(1376-1493)^2+(1650-1493)^2]=14068.667.
s2=31[(1502−1493)2+(1453−1493)2+(1376−1493)2+(1650−1493)2]=14068.667.样本均方差为
s
=
s
2
=
14068.667
=
118.611.
s=\sqrt{s^2}=\sqrt{14068.667}=118.611.
s=s2=14068.667=118.611.
下列代码验算本例计算结果。
import numpy as np #导入numpy
x=np.array([1502, 1453, 1367, 1650]) #设置样本数据
mean=x.mean() #计算样本均值
s2=x.var(ddof=1) #计算样本方差
s=x.std(ddof=1) #计算样本均方差
print('x_=%.4f'%mean)
print('s^2=%.4f'%s2)
print('s=%.4f'%s)
第3行调用array对象x的mean方法,计算样本均值 x ‾ \overline{x} x,第4,5行分别调用x的var方法和std方法计算样本方差 s 2 s^2 s2和样本均方差 s s s。运行程序,输出
x_=1493.0000
s^2=14068.6667
s=118.6114
由于
X
‾
\overline{X}
X和
S
2
S^2
S2是总体均值
μ
\mu
μ和总体方差
σ
2
\sigma^2
σ2的无偏估计,故可运用array对象的上述方法来计算
μ
\mu
μ和
σ
2
\sigma^2
σ2的点估计值,然后直接或间接地计算总体的未知参数估计值。
例2 设总体
X
X
X~
U
(
a
,
b
)
U(a, b)
U(a,b),
a
a
a和
b
b
b未知。
(
X
1
,
X
2
,
⋯
,
X
n
)
(X_1,X_2,\cdots,X_n)
(X1,X2,⋯,Xn)为来自
X
X
X的样本,用样本均值
X
‾
\overline{X}
X和样本方差
S
2
S^2
S2计算
a
a
a,
b
b
b的估计量。设容量
n
=
20
n=20
n=20的样本观测值为
1.248
,
1.664
,
1.101
,
1.967
,
1.468
,
1.140
,
1.434
,
1.063
,
1.878
,
1.375
1.819
,
1.704
,
1.328
,
1.619
,
1.830
,
1.764
,
1.034
,
1.553
,
1.878
,
1.166
1.248,1.664,1.101,1.967,1.468,1.140,1.434,1.063,1.878,1.375\\ 1.819,1.704,1.328,1.619,1.830,1.764,1.034,1.553,1.878,1.166
1.248,1.664,1.101,1.967,1.468,1.140,1.434,1.063,1.878,1.3751.819,1.704,1.328,1.619,1.830,1.764,1.034,1.553,1.878,1.166
计算
a
a
a,
b
b
b的估计值。
解:我们知道
E
(
X
)
=
a
+
b
2
E(X)=\frac{a+b}{2}
E(X)=2a+b,
D
(
X
)
=
(
b
−
a
)
2
12
D(X)=\frac{(b-a)^2}{12}
D(X)=12(b−a)2。用样本均值
X
‾
=
1
n
∑
i
=
1
n
X
i
\overline{X}=\frac{1}{n}\sum\limits_{i=1}^{n}X_i
X=n1i=1∑nXi和样本方差
S
2
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
‾
)
2
S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X})^2
S2=n−11i=1∑n(Xi−X)2,分别估计
E
(
X
)
E(X)
E(X)和
D
(
X
)
D(X)
D(X)。即
{
a
∧
+
b
∧
2
=
X
‾
(
b
∧
−
a
∧
)
2
12
=
S
2
\begin{cases} \frac{\stackrel{\wedge}{a}+\stackrel{\wedge}{b}}{2}=\overline{X}\\\frac{(\stackrel{\wedge}{b}-\stackrel{\wedge}{a})^2}{12}=S^2 \end{cases}
⎩
⎨
⎧2a∧+b∧=X12(b∧−a∧)2=S2
解此方程组,得参数
a
a
a与
b
b
b的估计量
{
a
∧
=
X
‾
−
3
S
b
∧
=
X
‾
+
3
S
\begin{cases}\stackrel{\wedge}{a}=\overline{X}-\sqrt{3}S\\\stackrel{\wedge}{b}=\overline{X}+\sqrt{3}S\end{cases}
{a∧=X−3Sb∧=X+3S
其中,
S
=
S
2
S=\sqrt{S^2}
S=S2为样本标准差。
样本均值的观测值为
x
‾
=
1
20
(
1.248
+
1.664
+
⋯
+
1.166
)
=
1.502
\overline{x}=\frac{1}{20}(1.248+1.664+\cdots+1.166)=1.502
x=201(1.248+1.664+⋯+1.166)=1.502
样本方差的观测值为
s
2
=
1
19
[
(
1.248
−
1.502
)
2
+
(
1.664
−
1.501
)
+
⋯
+
(
1.166
−
1.502
)
]
=
0.094
s^2=\frac{1}{19}[(1.248-1.502)^2+(1.664-1.501)^+\cdots+(1.166-1.502)^]=0.094
s2=191[(1.248−1.502)2+(1.664−1.501)+⋯+(1.166−1.502)]=0.094
样本均方差
s
=
s
2
=
0.307
s=\sqrt{s^2}=0.307
s=s2=0.307,代入
a
a
a,
b
b
b估计量表达式
{
a
∧
=
x
‾
−
3
s
=
0.970
b
∧
=
x
‾
+
3
s
=
2.034
.
\begin{cases}\stackrel{\wedge}{a}=\overline{x}-\sqrt{3}s=0.970\\\stackrel{\wedge}{b}=\overline{x}+\sqrt{3}s=2.034\end{cases}.
{a∧=x−3s=0.970b∧=x+3s=2.034.
下列代码验算本例计算结果。
import numpy as np #导入numpy
x=np.array([1.248, 1.664 ,1.101 ,1.967 ,1.468, #设置样本数据数组
1.140, 1.434, 1.063, 1.878, 1.375,
1.819, 1.704, 1.328, 1.619, 1.830,
1.764, 1.034, 1.553, 1.878, 1.166])
mu=x.mean() #计算样本均值
sigma=x.std(ddof=1) #计算样本标准差
a=mu-np.sqrt(3)*sigma #计算参数a的估计值
b=mu+np.sqrt(3)*sigma #计算参数b的估计值
print('用样本均值、方差估计a=%.4f, b=%.4f'%(a, b))
运行程序,输出
用样本均值、方差估计a=0.9697, b=2.0336
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
代码诚可贵,原理价更高。若为AI学,读正版书好。
返回《导引》