先验概率、最大释然估计(MLE)与最大后验估计(MAP)

最新推荐文章于 2023-01-30 18:53:16 发布

天空中的一缕微风

最新推荐文章于 2023-01-30 18:53:16 发布

阅读量3.1k

点赞数

分类专栏：数据分析文章标签：数据分析

本文链接：https://blog.csdn.net/zlbflying/article/details/48474837

版权

数据分析专栏收录该内容

4 篇文章 0 订阅

订阅专栏

前言

在数据分析和机器学习中，估计是一个很重要的内容，这里着重介绍下极大似然估计与极大后验估计。

最大似然估计(MLE)

    最大似然估计是模型已定，参数未定时的一种估计方法。比如说对于抛硬币而言，模型已定，可以看做是多个伯努利实验，我们所不知道的是这个硬币正面朝上的概率 $p$ ，所以我们的任务就是估计 $p$ 的值。极大似然估计的思想是，对于已经给定的一些观测数据，参数 $p$ 的取值应使得取得这些观测数据的概率最大。
    再以上面抛硬币为例，假设10次实验，7次正面朝上，此时根据极大似然估计 $p$ 的取值应该为 $7 \over 10$ ，具体计算过程一会给出。
    OK，这里总结出极大似然估计的一般过程。首先极大似然估计的前提是样本的采样是独立同分布的，假设现在得到的采样结果是 $x_1$ , $x_2$ , $x_3$ , $x_4$ , $x_5$ ……，给定参数 $\theta$ ，则取得该采样结果的联合概率为：

f (x 1, x 2, x 3, \dots ， x n; θ) = f (x 1; θ) \times f (x 2; θ) \times \dots \times f (x n; θ)

$f(x_1,x_2,x_3,…，x_n;\theta)=f(x_1;\theta)\times f(x_2;\theta)\times …\times f(x_n;\theta)$

L (θ | x 1, x 2, \dots, x n) = \prod i = 1 n f (x i | θ)

$L(\theta | x_1,x_2,…,x_n)=\prod_{i=1}^n f(x_i | \theta)$
为了求得

θ $\theta$ 的值使得

L(θ|x1,x2,…,xn) $L(\theta | x_1,x_2,…,x_n)$ 取得极大值，而连乘形式通常很难求值，因此一般情况下会把连乘转化成连加，即会求

L $L$ 的对数，如下所示：

l n L (θ | x 1, x 2, \dots, x n) = \sum i = 1 n l n f (x i | θ)

$lnL(\theta | x_1,x_2,…,x_n)=\sum_{i=1}^n lnf(x_i|\theta)$
此时

xi $x_i$ 是已知量，只有参数

θ $\theta$ 是未知量，因此对

θ $\theta$ 求导。

d l n L ( θ ) d θ = 0

${dlnL(\theta) \over d\theta} = 0$
求出

θ $\theta$ 的值即可。

特殊情况下， $L(\theta)$ 是一个递增函数或者其它比较简单的形式，我们无需进行求对数，只需直接判断即可。

现在对开头的抛硬币例子进行解释，我们可以判定每次抛硬币正面朝上的概率为 $f(x = 1|p) = p^x \times (1-p)^{(1-x)}$ ，则10次实验做完联合概率为
$L(x_1,x_2,…，x_{10} | p) = p^{x_1}*p^{x_2}*…p^{x_{10}} *(1-p)^{(1-x_1)}*…(1-p)^{(1-x_{10})} = \prod_{i=1}^{10} p^{x_i} \times (1-p)^{(1-x_i)}$
对其进行求对数