怎么理解最大似然估计

最新推荐文章于 2024-07-28 15:37:27 发布

学AI不秃头

最新推荐文章于 2024-07-28 15:37:27 发布

阅读量194

点赞数

分类专栏：最大似然估计文章标签：人工智能机器学习深度学习

本文链接：https://blog.csdn.net/a1691125058/article/details/131654916

版权

最大似然估计专栏收录该内容

2 篇文章 0 订阅

订阅专栏

最大似然估计

怎么判断机器学习它学得如何?

在这里插入图片描述

如上图,人工智能就是要让机器像人脑一样思考问题? 机器学习的过程就是在建模、在学习一个统计模型.

通过一些事物/数据,给出一个判断的结果.

人脑也可以抽象出来一个模型,用于对某些事物的判断辨别.

衡量模型的好坏可以利用人判断出来的结果和机器判断的结果进行比较,差别越小,就说明人脑中的模型与机器学到的模型越近似!

定量衡量结果的差别,常见的有最小二乘法,最大似然估计法和交叉熵

什么是最大似然估计?

在这里插入图片描述

再举个例子:

假如有一个盒子，里面有黑白两种颜色的球，数目多少不知，两种颜色的比例也不知。我们想知道罐中白球和黑球的比例，但我们不能把罐中的球全部拿出来数。现在我们可以每次任意从已经摇匀的罐中拿一个球出来，记录球的颜色，然后把拿出来的球再放回罐中。这个过程可以重复，我们可以用记录的球的颜色来估计罐中黑白球的比例。假如在前面的一百次重复记录中，有七十次是白球，请问罐中白球所占的比例最有可能是多少？

凭感觉，就能给出答案：70%！

为什么?

设白球概率是p，黑球是1-p（罐子中非黑即白）

取100个球，70次是白球，30次是黑球，概率可以表示:
$P(x|\theta) = C_{100}^{30}p^{70}(1-p)^{30}$
求p的的最大值,即求盒子中对应的概率模型的似然值.
$求最大值可以求个导,因为C_{100}^{30}是常量，可以去掉,不影响求p的最大值$
求导:
$P' = 70*p^{69}*(1-p)^{30} + p^{70}*30*(1-p)^{29}*(-1)$
令导数为0：
$0 = 70*p^{69}*(1-p)^{30} +p^{70}*30*(1-p)^{29}*(-1)$
最后化简得:

p = 70%

神不奇神奇!

总结:

最大似然估计: 一个事件A发生,求它最有可能对应的概率分布!

理解到这终于可以往下推为什么最小二乘法求最优解可以用最大似然估计法了

引入:

在许多情况下，我们的样本数据都会存在系统误差、测量误差, 测量误差受到多个独立因素的影响，这些因素可能是微小的不确定性、观测误差、环境噪声等等。根据中心极限定理，这些独立因素的累积效应会使得误差分布趋向于高斯分布。

高斯分布的概率密度函数提供了在给定均值和标准差的情况下，某个具体取值的相对概率密度。

将样本误差带入到高斯分布的概率密度函数中，意味着我们将误差值视为自变量，通过相对概率密度计算该误差值对应的概率密度。------最大似然估计

相对概率密度的理解:

相对概率密度是将某个取值范围内的概率密度函数与整个样本空间的概率密度函数相比较得到的。它告诉我们

在某个取值范围内事件的概率相对于整体样本空间的概率有多大。

就好比上面提到的抛硬币这件事
就是利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值！**
这些还是挺抽象的，专业名称什么的，好烦。

似然函数:

在这里插入图片描述

看到这个表达式,wtm又蒙圈了.看来还是觉得理解的不够透彻,有种云里雾里的感觉.可能平时对数学的学习所花的时间有点少.

经过了反反复复的百度+b站的探索…

发现,网上也是有好多同学,存在着和我相同的疑惑.他们表示,会把数据带入到公式计算,但根本不理解,为什么能怎么做?我也是这么想的

在这感想互联网让我找到了些许的共鸣,太感动了…

不扯了…

公式总是抽象的,现在的教科书也是一上来,就啪的一下搞一堆公式丢你脸上.然后就是例题.这也太应试了.

我想说,我的想法是:学习是探索的过程,而不是死磕的过程.是活的,不是死的!

学习是在探索中学会,怎么以自己最好理解的角度去分析一个问题

在b站评论区发现的一段评论:

前人开辟的路可以直接走，也可以先探寻再跟随。前者的好处在于快速，且能在几乎不理解缘由的情况下做出点东西；后者的虽然缓慢，却能加深对问题本质的理解，虽说难以立即出成果，但其中潜在益处却远高于前者。或者可以理解为，知识是现成的招式，可以照猫画虎的做；学习是内功，不断修炼积累后可以很快的吸收知识，甚至自己创造知识。

Ou god dam!讲的太好了，激起了我的共鸣
真不扯了。。。