图解极大似然估计

最新推荐文章于 2022-01-06 15:44:38 发布

NYAIoT

最新推荐文章于 2022-01-06 15:44:38 发布

阅读量2.1k

点赞数 2

分类专栏： # AI数学基础文章标签：图解极大似然估计极大似然估计似然估计似然函数

本文链接：https://blog.csdn.net/zenglaoshi/article/details/103285033

版权

本文通过3D可视化深入探讨极大似然估计的概念。极大似然估计是机器学习中优化模型的基础，它用于估计数据最可能产生的概率分布参数。文章首先解释了概率密度函数，然后介绍了似然函数和概率之间的区别。接着，通过实例展示了如何使用一组观测数据找到最符合该数据的正态分布参数，并探讨了对数似然函数的作用。最后，通过可视化帮助读者直观理解极大似然估计的过程。

摘要由CSDN通过智能技术生成

机器学习之数学之旅 图解极大似然估计$(maximum likelihood estimation with 3D visualization)$

极大似然估计**是神经网络和很多复杂模型得以优化求解的理论基础, 我们今天来学习并试着深入理解极大似然估计的原理和推导, 最后我们对极大似然估计进行3D可视化, 建立一种直观的认识.

要理解极大似然估计是什么, 首先要明白概率密度(质量)函数是什么, 如果你不知道的话, 那就简短解释一下：
概率密度函数用来描述某个随机变量取某个值的时候，取值点所对应的的概率 $(p r o b a b i l i t y)$ 的函数.
如下图, 我们现在有一个概率分布, 属于正态分布: $\sim N(\mu,\sigma^2), \quad f(x;\mu,\sigma)=\frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x- \mu)^2}{2\sigma^2} \right)$

其中 $\mu$ 是均值, $\sigma$ 是标准差. 如果你不熟悉正态分布, 我们简单回顾一下 $\mu$ 指的是均值, 在下图中, 均值是 $0$ 则正态分布的概率在均值处概率最高, 以均值为中心两边是对称的, $\sigma$ 是标准差, 标准差控制着概率分布偏离均值的程度, 标准差越大概率分布越扁平, 越小的话, 概率分布越集中于均值.

我们另有一个数据点, 是一个随机变量, 取值 $2.5$ , 我们将 $x = 2.5$ 代入 $f(x;\mu=5,\sigma=2)$ 得出下图出中绿色直线的长度, 也就是得到了 $\mid \mu=5, \sigma=2)$
意义为 $x = 2.5$ 在上面定义的正态分布中的概率, 也就是给定一个概率分布, 随机变量在这个概率分布中出现的可能性, 而 $f(x;\mu,\sigma)=\frac{1}{\sigma\sqrt{2\pi}} \, \exp \left( -\frac{(x- \mu)^2}{2\sigma^2} \right)$