闲谈：参数估计方法选取

最新推荐文章于 2024-07-19 22:36:21 发布

Votaver

最新推荐文章于 2024-07-19 22:36:21 发布

阅读量381

点赞数 1

分类专栏：理解文章标签：统计学概率论

本文链接：https://blog.csdn.net/Snappingpiggy1/article/details/126575897

版权

理解专栏收录该内容

6 篇文章 0 订阅

订阅专栏

闲谈：参数估计方法选取

参数估计有点估计(point estimation) 和 区间估计(interval estimation) 两种。

点估计在抽样推断中不考虑抽样误差，直接以抽样指标代替全体指标的一种推断方法。

区间估计根据抽样指标和抽样误差去估计全体指标的可能范围的一种推断方法。

在本科我们都学过两种构造点估计的方法： 矩估计 和 最大似然估计 ，我们也学过区间估计的 置信区间 构造。

那么对于多个可能的估计，我们要选择哪一个呢？ 从定性的角度考虑，我们应当选择：最能高度集中在真实数值上的。同样，本科我们学过一些无偏估计的概念。具有无偏性，是一种用于评价估计量优良性的准则。（可以回忆一下，估计量的数学期望等于被估计参数就是无偏）

实际上，我们需要先从所有估计中选出无偏的，再从中通过“效率”选择更有效的。

1 无偏

通常为了测量偏离程度，我们采用均方误差MSE（Mean Square Error） 作为量化测度，因为分析简单。
$MSE\left( \hat{\theta} \right) \ =\ E\left( \hat{\theta}-\theta _0 \right) ^2=Var\left( \hat{\theta} \right) +\left( E\left( \hat{\theta} \right) -\theta _0 \right) ^2$
其中， $\hat{\theta}$ 是 $\theta _0$ 的估计。

当估计是无偏的，样本的MSE将等于样本方差。

比如，考虑：

有一个度量X,真实值x0。 $X=x_0+\beta +\varepsilon$
其中， $\beta$ 是常数，是系统误差成分，常称 $\beta$ 为测量过程的偏倚bias； $\varepsilon$ 是一个随机变量，是随机误差成分。
那么 $E\left( X \right) =x_0+\beta$ $Var\left( X \right) =\sigma ^2$ 影响误差大小的两个因素分别是偏倚bias $\beta$ 和方差大小 $\sigma ^2$ 。我们认为 $\beta=0$
和 $\sigma ^2 = 0$ 时测量是完美的。 $MSE=E\left[ \left( X-x_0 \right) ^2 \right]$ $=Var\left( X-x_0 \right) +\left[ E\left( X-x_0 \right) \right] ^2$ $=Var\left( X \right) +\beta ^2$ $=\sigma ^2+\beta ^2$
也就是说，均方误差=方差+ 偏倚²

当无偏时，偏倚为0，所以均方误差等于方差。

2 效率

这里的效率实际上是得到相同方差所必需的样本容量比率。这是因为方差通常具有这种形式：
$Var\ =\frac{\text{常数}}{\text{样本容量}}$

在无偏时，均方误差等于方差，有：

$eff\left( \hat{\theta},\tilde{\theta} \right) =\ \frac{Var\left( \hat{\theta} \right)}{Var\left( \tilde{\theta} \right)}=\frac{MSE\left( \hat{\theta} \right)}{MSE\left( \tilde{\theta} \right)}$
其中， $\hat{\theta}$ 和 $\tilde{\theta}$ 是 $\theta _0$ 的不同估计。（实际上，这种比较在它们都无偏或具有相同偏倚时才有意义）
从而，这种比较包含样本容量的比较。

在无偏情况下，我们将比较效率进行择优。（有时，精确方差无法达到闭式解，可以采用渐进方差，得到渐进相对效率）

不同于矩估计，最大似然估计的情况下，方差闭形式下无解，需要用渐近方差进行近似。
$Var\left( \hat{\alpha} \right) \approx \frac{1}{nI\left( \alpha \right)}$

其中， $I\left( \theta \right) =E\left[ \frac{\partial}{\partial \theta}\log f\left( x\left| \theta \right. \right) \right] ^2$
f光滑时， $I\left( \theta \right) =-E\left[ \frac{\partial ^2}{\partial \theta ^2}\log f\left( x\left| \theta \right. \right) \right]$
这个定义在最大似然估计的大样本分布里。在样本容量趋于无穷时，最大似然估计的大样本分布近似服从均值 $\theta _0$ ，方差 $\frac{1}{nI\left( \theta _0 \right)}$ 的正态分布。