本文摘自《概率论与数理统计》 陈希孺著 中国科学技术大学出版社
相关链接
参数的点估计问题
极大似然估计
前言
矩估计法是点估计方法的一种,点估计法还有极大似然估计法和贝叶斯估计法。详情请参考上面的链接。
矩估计法
矩估计法是皮尔逊在19世纪末到20世纪初的一系列文章中引进的。这个方法的思想很简单:设总体分布为
f(x;θ1,⋯,θk)
,则它的矩(原点矩和中心矩都可以,此处以原点矩为例)
连续型:
αm=∫∞−∞xmf(x;θ1,⋯,θk)dx
离散型:
αm=∑i=1nxif(xi;θ1,⋯,θk)
依赖于
θ1,⋯,θk
。另一方面,至少在样本
n
较大时,
αm=αm(θ1,⋯,θk)≈am=∑i=1nXmin
取
m=1,⋯,k
,并将上面的近似式改成等式,就得到一个方程组:
αm(θ1,⋯,θk)=am,(m=1,⋯,k)
解此方程组,得其根 θi^=θi^(X1,⋯,Xn) (i=1,⋯,k) ,就以 θi^ 作为 θi 的估计 (i=1,⋯,k) 。如果要估计的是 θ1,⋯,θk 的某个函数 g(θ1,⋯,θk) ,则用 ĝ (X1,⋯,Xn)=g(θ1^,⋯,θk^) 去估计它。这样定出的估计量就叫矩估计。
矩估计在各种分布中的应用
正态分布
设
X1,⋯,Xn
是从正态总体
N(μ,σ2)
中抽出的样本,要估计
μ
和
σ2
。
μ
是总体的一阶原点矩,按矩估计,用样本的一阶原点矩即样本的均值
X⎯⎯⎯
去估计。
σ2
是总体方差,即总体的二阶中心距,可用样本的二阶的二阶中心矩
m2
去估计。一般地,在估计方差时候常用样本方差
S2
而不用
m2
,即对矩估计做了一定的修正。
如果要估计的是标准差
σ2
,则由
σ=σ2‾‾‾√
,按矩估计法,它可以用
m2‾‾‾√
去估计,一般用
S2‾‾‾√=S
去估计,或者还做点修正。又当
μ≠0
时,(特别在
μ>0
时,在有些问题中,
μ
虽然未知,但事先可知道
μ>0
。比如某个班级的平均成绩,它必然会大于0,因为没有人会考负分,全班也不太可能考0分),
σ/μ
称为总体的变异系数,变异系数是以均值为单位去衡量总体的标准差。在有些问题中,反映变异程度的标准差意义如何,要看总体均值
μ
而定。比如一大群人收入的标准差为50元,若其平均工资只有70元,则这个变异系数可算很大了;但若平均工资为850元,则这个变异程度就不算大了。所以,变异系数
σ/μ
不过是一定意义上的“相对误差”,按矩估计法,为估计
σ/μ
可用
m2‾‾‾√/X⎯⎯⎯
,一般用
S/X⎯⎯⎯
。
指数分布
设
X1,⋯,Xn
是从指数分布总体中抽出的样本,要估计参数
λ
的倒数
1λ
。根据指数分布的特点,我们知道
1λ
就是总体分布的均值,故按矩估计法,就用
X⎯⎯⎯
去估计。如要估计的是参数
λ
本身,就用
1X⎯⎯
去估计。
另一方面,指数分布的方差为
1λ2
,即
1λ=总体二阶中心矩‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾√
。按矩估计法,
1λ
也可以用
m2‾‾‾√
(或
S
)去估计。
均匀分布
设
我们知道,均匀分布的均值、方差分别是
(θ1+θ2)2
和
(θ2−θ1)212
。因此,按矩估计法,建立方程
X⎯⎯⎯=(θ1+θ2)2,m2=(θ2−θ1)22
得出
θ1,θ2
的解分别为
θ̂ =X̂ −3m2‾‾‾‾√,θ2^=X⎯⎯⎯+3m2‾‾‾‾√ 公式(1)
也可以用
S
代替
二项分布
设总体有二项分布
B(N,p)
,
X1,⋯,Xn
为从该总体中抽出的样本,要估计
p
,矩估计为
我们知道,
X⎯⎯⎯=Np,m2=Np(1−p)
根据上面的式子,我们可以得到 p=X⎯⎯⎯/N ,当然也可用 m2 来求。
泊松分布
设总体有泊松分布
P(λ),X1,⋯,Xn
为从该总体中抽出的样本,要估计
λ
。
由于
λ
是总体分布的均值,按矩估计法,可用样本均值
X⎯⎯⎯
去估计;另一方面,
λ
也是总体分布的方差,故按矩估计法,也可以用
m2
或
S2
去估计。在这里,用均值
X⎯⎯⎯
为优。在一般的情况下,能用低阶矩处理的就不用高阶矩。