白板推导机器学习-开篇

最新推荐文章于 2023-07-29 14:09:01 发布

Harrytsz

最新推荐文章于 2023-07-29 14:09:01 发布

阅读量851

点赞数 1

分类专栏：人工智能机器学习深度学习

本文链接：https://blog.csdn.net/harrytsz/article/details/88526201

版权

人工智能同时被 3 个专栏收录

96 篇文章 6 订阅

订阅专栏

机器学习

57 篇文章 7 订阅

订阅专栏

深度学习

31 篇文章 2 订阅

订阅专栏

频率派 VS 贝叶斯派

机器学习中引入概率很自然，把数据当做是一个概率模型。
X：表示数据 data ——> 有 N 个样本，每个样本维度为 P： $(x_{1} x_{2} ... x_{N})^{T}_{N \times P}$
$\theta$ ：表示参数 parameter

频率派：认为模型的参数 $\theta$ 是一个未知的常量。数据 X 是一个随机变量，关心的是数据。需要将未知的常量 $\theta$ 给估计出来。常用的方法是最大似然估计：

MLE：极大似然估计
$\theta_{MLE} = argmax_{\theta} log P(X|\theta)$

$x_{i} \sim^{iid} p(x|\theta)$

贝叶斯派：和频率派不同，贝叶斯派认为参数 $\theta$ 不是常量， $\theta$ 本身也是一个随机变量，服从一个概率分布。 $\theta \sim p(\theta)$ 称为先验。

借助贝叶斯定理把参数的先验和后验用似然将其连接起来：
$p(\theta|X) = \frac{p(X|\theta) * p(\theta)}{p(X)} \propto p(X|\theta) * p(\theta)$

分母 $\int_{\theta}p(X|\theta)*p(\theta)d\theta$

MAP:最大后验估计
从严格意义上讲，MAP并不是标准的贝叶斯方法。标准的贝叶斯方法就是要求积分！

贝叶斯估计：标准的贝叶斯估计就是要求解 ——> $p(\theta|X) = \frac{p(X|\theta) * p(\theta)}{\int_{\theta}p(X|\theta)*p(\theta)d\theta}$
贝叶斯估计的目的就是要求概率分布 $p(\theta|X)$ 整体，那么求出这个后验概率分布能够做什么呢？可以引入一个贝叶斯预测！

贝叶斯预测：已知数据X，若引入一个新数据 $\widetilde{x}$ ，这个预测问题就是要求 $p(\widetilde{x}|X) = \int_{\theta}p(\widetilde{x}, \theta|X)d\theta = \int_{\theta}p(\widetilde{x}|\theta)p(\theta|X)d\theta$ (此时，需要引入参数 $\theta$ 作为已知数据X和未知数据 $\widetilde{x}$ 之间的桥梁)
所以在做预测问题时，我们必须要先求解出后验概率 $p(\theta|X)$