频率学派与贝叶斯学派

最新推荐文章于 2021-06-06 00:13:53 发布

Rhine_Yu

最新推荐文章于 2021-06-06 00:13:53 发布

阅读量417

点赞数

分类专栏： Machine Learning 文章标签：贝叶斯学派频率学派 MLE MAP

本文链接：https://blog.csdn.net/RhineYu/article/details/79734045

版权

本文介绍了频率学派和贝叶斯学派在统计推断中的基本观点，强调了最大似然估计（MLE）和最大后验估计（MAP）的差异。频率学派认为参数存在唯一真值，而贝叶斯学派视参数为随机变量，并结合先验知识进行估计。MLE忽略了先验信息，而MAP则融合了先验和似然，当先验为均匀分布时，两者结果相近。

摘要由CSDN通过智能技术生成

Key point

频率学派（Frequentist）- Maximun Likelihood Estimation（MLE，最大似然估计）

贝叶斯学派（Bayesian）- Maximum A Posteriori（MAP，最大后验估计）

两大学派的争论

抽象地说，两大学派对世界的认知有本质不同：

频率学派认为世界是确定的，有一个本体，这个本体的真值是不变的，我们的目标是找到这个真值或真值所在的范围；
贝叶斯学派认为世界是不确定的，人们对世界先有一个预判，而后通过观测数据对这个预判做调整，我们的目标是找到最优的描述这个世界的概率分布。

频率学派

$\theta$ 是一个参数，存在唯一真值 $\theta$ 。举一个抛硬币的例子，用 $P(head)$ 来表示硬币的bias。抛一个硬币100次，有20次正面朝上，要估计正面朝上的bias $P(head)=\theta$ ，频率学派认为 $\theta=0.2$ 。

当数据趋向无穷大时，这种方法能给出精确的估计，但是当数据缺乏时可能产生严重的偏差。如，对于一枚均匀硬币， $\theta=0.5$ ，抛5次，每次都是正面朝上，那频率学派会估计这枚硬币 $\theta=1$ ，出现严重错误。

贝叶斯学派

$\theta$ 是一个随机变量，符合一定的概率分布。贝叶斯学派里输入是先验（prior）和似然（likelihood），输出是后验（posterior）。

先验，即 $P(\theta)$ ，指的是没有观测到任何数据时对 $\theta$ 的预先判断，例如对于一枚硬币，一种可行的先验的是认为这个硬币有很大的概率是均匀的，有较小的概率是不均匀的；似然，即 $P(\theta)$ ，是假设已知我们观察到的数据应该是什么样子的；后验，即 $P(\theta|X)$ ，是最终的参数分布。