统计学习知识点整理——极大似然估计（MLE）与最大后验概率(MAP)

最新推荐文章于 2024-07-12 16:55:56 发布

Turned_MZ

最新推荐文章于 2024-07-12 16:55:56 发布

阅读量960

点赞数

分类专栏：统计学习文章标签：人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mingzheng114/article/details/116108788

版权

统计学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

统计学习知识点整理——极大似然估计（MLE）与最大后验概率(MAP)

似然函数与概率函数

似然（likelihood）这个词其实和概率（probability）是差不多的意思，对于下面的式子：

P ( x ∣ θ )

输入有两个：x表示某一个具体的数据；θ 表示模型的参数。

如果θ 是已知确定的，x 是变量，这个函数叫做概率函数(probability function)，它描述对于不同的样本点x，其出现概率是多少。

如果x 是已知确定的，θ 是变量，这个函数叫做似然函数(likelihood function), 它描述对于不同的模型参数，出现x这个样本点的概率是多少。

极大似然估计

极大似然估计，通俗理解来说，就是利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值。

特点：简单适用；在训练样本增多时通常收敛得很好；基于所有的采样都是独立同分布的假设；

对于样本的概率：

$p(X|\theta )=\prod_{x1}^{xn}p(xi|\theta )$

目标就是要求一个θ，使得上面的概率最大，为了计算简化，对式子取对数：

$p(X|\theta )=\prod_{x1}^{xn}p(xi|\theta )=\sum_{x1}^{xn}logp(xi|\theta )$

要最大化L，对L求导数并令导数为0即可求解。

最大后验概率

最大后验估计（MAP－Maxaposterior）：求p(D|θ )*p(θ)取最大值的那个参数向量θ，最大似然估计可以理解为当先验概率p(θ)为均匀分布时的MAP估计器。（MAP缺点：如果对参数空间进行某些任意非线性变换，如旋转变换，那么概率密度p(θ)就会发生变化，其估计结果就不再有效了。）根据经验数据获得对难以观察的量的点估计。与最大似然估计类似，但是最大的不同时，最大后验估计的融入了要估计量的先验分布在其中，可看做是规则化的最大似然估计

由贝叶斯公式：

P(X)是已经发生的事情，为固定值，所以最大化后验概率P(θ|X)就是最大化P(X|θ)P(θ)

至于上面目标函数的求解，也和极大似然估计是一样的，对目标函数求导并令导数为0来求解。

MAP与MLP的区别

MAP与MLE最大区别是MAP中加入了模型参数本身的概率分布，或者说，MLE中认为模型参数本身的概率的是均匀的，即该概率为一个固定值。MAP允许我们把先验知识加入到估计模型中，这在样本很少的时候是很有用的，因为样本很少的时候我们的观测结果很可能出现偏差，此时先验知识会把估计的结果“拉”向先验，实际的预估结果将会在先验结果的两侧形成一个顶峰。通过调节先验分布的参数，比如beta分布的，我们还可以调节把估计的结果“拉”向先验的幅度，越大，这个顶峰越尖锐。这样的参数，我们叫做预估模型的“超参数”。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
统计学习知识点整理——极大似然估计（MLE）与最大后验概率(MAP)

统计学习知识点整理——极大似然估计（MLE）与最大后验概率(MAP)似然函数与概率函数似然（likelihood）这个词其实和概率（probability）是差不多的意思，对于下面的式子：P ( x ∣ θ )输入有两个：x表示某一个具体的数据；θ 表示模型的参数。如果θ 是已知确定的，x 是变量，这个函数叫做概率函数(probability function)，它描述对于不同的样本点x，其出现概率是多少。如果x 是已知确定的，θ 是变量，这个函数叫做似然函数(likelihood.
复制链接

扫一扫

专栏目录

Turned_MZ CSDN认证博客专家 CSDN认证企业博客

码龄10年

50: 原创

6万+: 周排名

90万+: 总排名

14万+: 访问

: 等级

979: 积分

364: 粉丝

88: 获赞

64: 评论

669: 收藏

私信

关注

热门文章

分类专栏

最新评论

端侧模型性能优化——Flops与访存量的坑
城城城_: 请问几个表格是怎么获得的？
端侧模型性能优化——Flops与访存量的坑
我的肚子圆鼓鼓: 谢谢作者的回复^-^有成熟的工具可以计算访存量么？手动逐层计算的话有些麻烦
端侧模型性能优化——Flops与访存量的坑
Turned_MZ: 是的，如果不考虑缓存的话，放存量=参数量+output，但是实际上推理时，是有缓存来加速的，所以也要看具体的加速算子的实现来评估性能
端侧模型性能优化——Flops与访存量的坑
我的肚子圆鼓鼓: 你好看了你的文章很有收获。模型的访存量如何计算？现有的工具如torchinfo都只给处了MAC和参数量等指标，访存量应该等于参数量加上output和input的内存占用之和
端侧模型性能优化——Flops与访存量的坑
不曾抖动的地平线: 讲的很不错

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。