经验似然方法

最新推荐文章于 2024-05-13 18:10:29 发布

P_Y_L_U

最新推荐文章于 2024-05-13 18:10:29 发布

阅读量4.5k

点赞数 8

分类专栏：统计文章标签：统计学

本文链接：https://blog.csdn.net/P_Y_L_U/article/details/120293681

版权

统计专栏收录该内容

6 篇文章

订阅专栏

文章目录

简单介绍
一、经验分布
二、经验似然求解过程
总结

简单介绍

经验似然是一种非参数极大似然方法，而且是一种带限制条件的的非参数似然，在一般的正则条件下，有比较好的统计性质，例如：用经验似然方法构造的置信区间或置信域有域保持性，变换不变性，置信域的形状由数据自行决定，Bartlett纠偏性（可以将置信区间的覆盖率误差的收敛速度提高到$O(n^{-2})$），以及无需构造轴统计量等优点。

一、经验分布

设 $X_1$ , $X_2$ , …, $X_n$ 是服从分布 $F_0$ 的 iid 样本，则经验分布为
$F_n = \frac{1}{n}\sum_{i=1}^nI(X_i\leq x),$
其中， $I(\cdot)$ 表示示性函数。
利用极大似然方法，则经验似然函数为
$L(\boldsymbol{\theta})=\left\{\prod_{i=1}^np_i : p_i\geq0, \ \sum_{i=1}^n p_i=1\right\}。$
则对样本 $X_1,...,X_n$ ，使 $\prod_{i=1}^np_i$ 达到最大，必有 $\hat{p}_i=\frac{1}{n}$ .
因此，在简单样本下，经验分布函数 $F_n$ 是分布函数 $F_0$ 的非参数极大似然估计。

二、经验似然求解过程

设 $X_1$ , $X_2$ , …, $X_n$ 是 iid 随机变量，其分布为 $F(\boldsymbol{\theta})$ ， $\boldsymbol{\theta}$ 的维度为 $p$ 。假设关于 $F$ 和 $\boldsymbol{\theta}$ 的信息有 $(r\geq p)$ 个独立的无偏估计函数 $\boldsymbol{\psi(x,\theta)}$ 使得 $E_F\boldsymbol{\psi(X,\theta)=0}。$
利用极大似然估计的想法，极大化如下目标函数：
$\prod_{i=1}^ndF(x_i) =\prod_{i=1}^np_i$
其中，$p_i = dF(x_i) = P(X_i = x_i)，且满足
$p_i\geq0, \quad \sum_{i=1}^n p_i=1,\quad \sum_{i=1}^np_i\boldsymbol{\psi(x_i,\theta)}=0。$

因此，log经验似然函数为
$L(\boldsymbol{\theta})=\left\{\prod_{i=1}^np_i : p_i\geq0, \ \sum_{i=1}^n p_i=1,\ \sum_{i=1}^np_i\boldsymbol{\psi(x_i,\theta)}=0\right\}。$
因此，极大化上述经验似然，可得 $\boldsymbol{\theta}$ 的经验极大似然估计，即 $\boldsymbol{\hat{\theta}}=\argmax_{\boldsymbol{\theta}}L(\boldsymbol{\theta})。$
采用拉格朗日乘子法解上述问题，有
$H_n = \sum_{i=1}^n\log p_i - \eta(1-\sum_{i=1}^np_i) - n\boldsymbol{\lambda}^T\sum_{i=1}^np_i\boldsymbol{\psi(x_i, \theta)},$
其中， $\eta$ 和 $\boldsymbol{\lambda}$ 为拉格朗日乘子。对 $p_i$ 求导，得分函数为
$0=S_i = \frac{\partial H_n}{\partial p_i} = \frac{1}{p_i} - \eta - n\boldsymbol{\lambda}^T\boldsymbol{\psi(x_i, \theta)} ,$
等式两边同时乘以 $p_i$ ，得
$1-\eta p_i - np_i\boldsymbol{\lambda^T\psi(x_i, \theta)}=0。$
由于对每一 $p_i$ ，上式均成立。因此，
$n-\eta \sum_{i=1}^np_i -n\boldsymbol{\lambda}^T \sum_{i=1}^np_i\boldsymbol{\psi(x_i, \theta)}=0$
也成立。结合经验似然函数得条件，可求得 $\eta$ 的经验极大似然估计为 $\hat{\eta} = n。$
将 $\hat{\eta} = n$ 代入得分函数中，有
$\frac{1}{p_i} - n - n\boldsymbol{\lambda}^T\boldsymbol{\psi(x_i, \theta)}=0，$
解上式，得 $p_i$ 的经验极大似然估计为 $\hat{p}_i = \frac{1}{n \{1+\boldsymbol{\lambda}^T\boldsymbol{\psi(x_i, \theta)}\}}。$
将 $\hat{p_i}$ 代入log似然函数中，有
$H_n = \sum_{i=1}^n\log \frac{1}{n \{1+\boldsymbol{\lambda}^T\boldsymbol{\psi(x_i, \theta)}\}}$
关于 $\boldsymbol{\lambda}$ 求导，
$\frac{\partial H_n}{\partial \boldsymbol{\lambda}} = \sum_{i=1}^n\frac{\boldsymbol{\psi(x_i, \theta)}\}}{\{1+\boldsymbol{\lambda}^T\boldsymbol{\psi(x_i, \theta)}\}}=0，$
解上式，得 $\boldsymbol{\lambda}$ 的经验极大似然估计为 $\hat{\boldsymbol{\lambda}}$ 。