浅谈贝叶斯（一）

最新推荐文章于 2024-08-15 11:25:22 发布

Matrix_11

最新推荐文章于 2024-08-15 11:25:22 发布

阅读量1.9k

点赞数 4

分类专栏：机器学习

本文链接：https://blog.csdn.net/matrix_space/article/details/81988954

版权

机器学习专栏收录该内容

113 篇文章 145 订阅

订阅专栏

一直都觉得贝叶斯定理是个非常神奇的东西，以前总是被什么先验概率，后验概率，最大似然估计什么的搞得昏头转向的，让人摸不着北，总感觉贝叶斯定理有点违反直觉，但是生活中却又经常会遇到。

相信很多人对下面这样的问题一定不感到陌生：

假设有两个盒子，我们姑且称为 A 和 B， A 盒子里有 4 个红球，6 个绿球，B 盒子里有 2 个红球，8 个绿球。我们从 A 盒子或者 B 盒子里取出一个球，记录球的颜色，然后再放回去，这样做了很多次这样的取球实验，假设从 A 盒子或者 B 盒子取球的概率都是一样的，都为 $1/2$ ，那么：
1）取到红球的概率是多少
2）如果取到的球是绿球，那么这个红球是从 B 盒子取出来的概率是多少

相信对于问题 (1)，很多人都会有一个直观的理解，但是对于问题 (2)，恐怕就得好好想想了，贝叶斯定理，就是用来帮我们解决这个问题的，对于观察到的数据 $D$ ，我们要求其背后的假设 $H$ ，这个时候就要用贝叶斯定理来解决。

在解答这道题之前，我们先来看看大名鼎鼎的贝叶斯定理，到底是个什么鬼：

P (X, Y) = P (X) P (Y | X) = P (Y) P (X | Y)

$P(X, Y) = P(X) P(Y | X) = P(Y) P(X | Y)$

没错，这就是传说中的贝叶斯定理，上面这个表达式， $P(X, Y)$ 是联合概率， $P(X), P(Y)$ 是边缘概率， $P(Y | X) , P(X | Y)$ 是条件概率，为了说明这几个概念之间的关系，在 pattern recognition and machine learning 中，列举了一个很形象的例子：

这里写图片描述

想象有这样一组格子，有一系列的点，随机的落在这些格子里，横向的格子坐标用 $X$ ，纵向的格子坐标用 $Y$ 表示，通过计算得知，所有格子里的点的总和为 $N$ ，如上图所示，在 $X = i, Y = j$ 这个格子里，落入的点的数目为 $n_{ij}$ ，那么：

P (X = x i, Y = y j) = n i j N

$P(X = x_i, Y = y_j) = \frac{n_{ij}}{N}$

如果我们想知道第 $i$ 列所有的点的数目，那么我们只要把第 $i$ 列所有格子里的点的数目相加即可：

P (X = x i) = \sum j P (X = x i, Y = y j) = c i N

$P(X = x_i) = \sum_j P(X = x_i, Y = y_j) = \frac{c_i}{N}$

同样的，我们可以得到：

P (Y = y j | X = x i) = n i j c i

$P(Y = y_j | X = x_i ) = \frac{n_{ij}}{c_i}$

因此，我们可以得到：

P (X = x i, Y = y j) = n i j c i \cdot c i N = P (Y = y j | X = x i) P (X = x i)

$P(X = x_i , Y = y_j) = \frac{n_{ij}}{c_i} \cdot \frac{c_i}{N} = P(Y = y_j | X = x_i) P(X = x_i)$

有了这个定理，我们再来回头看看之前的问题，我们假设 $X$ 表示取盒子， $Y$ 表示取球，我们可以定义 $X = \{ A, B \}$ ， $Y = \{ r, g \}$ , 根据之前的定义，我们知道：

$P (X = A) = P(X = B) = \frac{1}{2}$

利用条件概率，我们可以求得：

$P(Y =r | X = A) = \frac{4}{10} \quad , P(Y =g | X = A) = \frac{6}{10}$
$P(Y =r | X = B) = \frac{2}{10} \quad , P(Y =g | X = B) = \frac{8}{10}$

对于第一个问题, 就是求 $P(Y = r)$ 的概率：

$P(Y = r) = P(Y = r, X = A) + P(Y =r, X =B ) = \frac{3}{10}$

对于第二个问题，就是求 $P(X=B | Y =g)$ 的概率：

根据贝叶斯定理，我们可以得到：

P (X = B | Y = g) = P ( X = B , Y = g ) P ( Y = g )

$P(X = B | Y = g ) = \frac{ P(X = B, Y = g) }{ P(Y =g) }$

因为 $P(Y =r) = 3 / 10$ ，所以 $P(Y = g) = 7/10$ ，而且通过计算我们可以得到 $P(X = B, Y = g) = 4 / 10$ ，所以

P (X = B | Y = g) = 4 / 7

$P(X = B | Y = g) = 4 / 7$

在我们没有看到球之前，我们只能根据先验，认为 P(X = B) 的概率是 $1/ 2$ ，但是一旦我们看到取出来的球是绿球之后，我们立马修正了我们的判断，其后验概率变成了 $P(X = B | Y = g) = 4 / 7$ ，比一半要高一点，因为 $A$ 盒子里有 6 个绿球，而 $B$ 盒子里有 8 个绿球，所以，绿球从 B 盒取出来的概率也应该更高一点，这是符合常识的。