最大似然估计

最新推荐文章于 2024-05-01 18:25:48 发布

Angel_Yuaner

最新推荐文章于 2024-05-01 18:25:48 发布

阅读量5.1k

点赞数 2

分类专栏：概率论&数理统计

本文链接：https://blog.csdn.net/angel_yuaner/article/details/47833337

版权

概率论&数理统计专栏收录该内容

6 篇文章 2 订阅

订阅专栏

最大似然估计是对概率密度函数的一种参数估计。就是说，样本的概率密度函数形式是已知的，但是函数中的某些或全部的参数未知，我们需要根据样本来估计这些参数的值。

一、最大似然估计的基本原理
我们首先做以下的基本假设：

记待估计的参数为 $\theta$ ，这个量不是随机变量，而是确定的值，只是我们还不知道是多少而已；
将每类的样本集记作 $\chi_i,i=1,2,...,c$ 。其中每个样本都满足独立同分布；
类条件概率密度 $p(x|w_i)$ 的函数形式是确定的，就是说我们知道这些变量是服从什么分布，这样才知道是要求哪些未知参数。为了强调 $\theta$ 是待估计的参数，我们将 $p(x|w_i)$ 写作 $p(x|w_i,\theta)$ 或 $p(x|\theta)$
不同类别的参数也是独立的，各类样本只包含本类的分布信息，这样才可以分别对每一类单独处理。每一类的参数 $\theta_i$ 都是独立的，这样我们就可以将 $c$ 个类别的估计分成 $c$ 个独立的问题来处理。

设：样本集包含了 $N$ 个样本，即：

χ = {x 1, x 2, \dots, x N}

$\chi=\{x_1,x_2,\ldots,x_N\}$
获得这个样本集的概率就是各个样本的联合概率：

l (θ) = p (χ | θ) = p (x 1, x 2, \dots, x N | θ) = \prod i = 1 N p (x i | θ)

$l(\theta)=p(\chi|\theta)=p(x_1,x_2,\ldots,x_N|\theta)\\=\prod_{i=1}^{N}p(x_i|\theta)$

公式(1)反应了这概率密度函数的参数是 $\theta$ 时，得到样本 $\chi$ 的概率，称作参数 $\theta$ 相对于样本集 $\chi$ 的似然函数，而乘积中的每一项 $p(x_i|\theta)$ 就是 $\theta$ 相对于每一个样本的似然函数。

现在我们来看，我们从一次抽样中得到的 $N$ 个样本，我们想要知道这组样本“最可能”来自哪个密度函数；换句话说，所抽取的样本来自哪个密度函数（ $\theta$ 取什么值）的可能性最大？所以我们要的 $\theta$ 是使似然函数 $l(\theta)$ 最大的那个 $\theta$ 值，因为这组样本最可能来自这个密度函数。我们将这样的参数记作 $\hat{\theta}$ ， $\hat{\theta}$ 叫做 $\theta$ 的最大似然估计。

定义：令 $l(\theta)$ 是样本集 $\chi$ 的似然函数， $\chi=\{x_1,x_2,\ldots,x_N\}$ ，如果 $\hat{\theta}=d(\chi)=d(x_1,x_2,\ldots,x_N)$ 是参数空间 $\Theta$ 中能使似然函数 $l(\theta)$ 极大化的 $\theta$ 值，则 $\hat{\theta}$ 就是 $\theta$ 的最大似然估计量，记作：