MLE&MAP

最新推荐文章于 2023-08-21 12:35:07 发布

一有bug就哭给你看

最新推荐文章于 2023-08-21 12:35:07 发布

阅读量245

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40833196/article/details/104659243

版权

文章目录

Intro
两大学派的争论
先验与后验、似然
Maximum Likelihood Estimation
Maximum A Posteriori
总结：
Reference

Intro

学MLE时遇到这么一句话

A nice feature of this view is that we can now also interpret the
regularization term R(W) in the full loss function as coming from a
Gaussian prior over the weight matrix W, where instead of MLE we are
performing the Maximum a posteriori (MAP) estimation.

翻译过来就是：当在MLE中W是高斯先验条件时，并且加上一个正则项，我们可以看成是MAP。查了一下资料，才知道这是MLE和MAP的转换关系。

两大学派的争论

频率学派 - Frequentist - Maximum Likelihood Estimation (MLE，最大似然估计)
贝叶斯学派 - Bayesian - Maximum A Posteriori (MAP，最大后验估计)
频率学派和贝叶斯学派对世界的认知有本质不同：频率学派认为世界是确定的，有一个本体，这个本体的真值是不变的，我们的目标就是要找到这个真值或真值所在的范围；而贝叶斯学派认为世界是不确定的，人们对世界先有一个预判，而后通过观测数据对这个预判做调整，我们的目标是要找到最优的描述这个世界的概率分布。

先验与后验、似然

比如我们研究一个神经网络，其网络参数 $\theta$ 是我们要求的，虽然网络参数是多维的，但对单个参数成立的话，对多维参数也成立。并且，我们对 $\theta$ 的估计在网络输出值 $X={X_1,X_2,..X_n}$ 的基础上进行。

$p(\theta)$ 就是先验概率，即对网络的预先判断。比如我们迁移学习时，就能将被迁移的网络参数当成先验。
$p(\theta|X)$ 就是后验概率，即 $X$ 产生后对 $\theta$ 的估计
$p(X|\theta)$ 似然函数，类似于概率密度函数。
注意，无论先验、后验、似然，都是关于 $\theta$ 的函数

Maximum Likelihood Estimation

即最大似然估计。

最低0.47元/天解锁文章

一有bug就哭给你看

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。