朴素贝叶斯:后验概率最大化的推导

流易hh

已于 2024-07-22 19:35:26 修改

阅读量726

点赞数 9

分类专栏：机器学习算法文章标签：机器学习概率论

于 2024-07-22 16:45:14 首次发布

本文链接：https://blog.csdn.net/liu7418520963/article/details/140613473

版权

机器学习算法专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文是记录在学习朴素贝叶斯的后验概率最大化的推导遇到的一些疑问, 以供参考.

首先, 我们可以知道朴素贝叶斯分类器可以表示为:
$y=f(x)=\arg\max_{c_k}P(Y=c_k)\prod_jP(X^{(j)}=x^{(j)}|Y=c_k)$
假设损失函数为: $L (Y, f (X))$ , 所以期望损失函数为:
$\begin{aligned} R_{exp}f(x)&= E(L(Y, f(X)) \\ &= \sum_{x\in X}\sum_{c_k \in Y} L(y=c_k, f(x)) P(X=x, Y=c_k) \\ &= \sum_{x\in X}\sum_{c_k \in Y} L(y=c_k, f(x)) P(Y=c_k|X=x) P(X=x) \\ &= \sum_{x\in X}\bigg[\sum_{c_k \in Y} L(y=c_k, f(X)) P(Y=c_k|X=x)\bigg] P(X=x) \\ &= E_X\bigg[\sum_{c_k \in Y} L(y=c_k, f(X)) P(Y=c_k|X=x)\bigg] \end{aligned}$
当损失函数是 0-1 损失函数
$\left\{ \begin{array}{cc} 1, & Y \neq f(X) \\ 0, & Y = f(X) \end{array} \right.$

若预测值 $f (x) = y$ , 期望损失函数为 $E (0) = 0$ ;

若预测值 $)\neq y$ , 期望损失函数为 $E_X\bigg[\sum_{c_k \in Y} P(y \neq c_k|X=x)\bigg]$

所以最小化期望损失函数就是:
$=\arg\min_{c_k}E_X\bigg[\sum_{c_k \in Y} P(y \neq c_k|X=x)\bigg]$
因为 $P (x)$ 是概率密度函数, 相当于 $\sum_{c_k \in Y} P(y \neq c_k|X=x)$ 这一部分的权重,
所以最小化 $E_X\bigg[\sum_{c_k \in Y} P(y \neq c_k|X=x)\bigg])$ 就相当于对每个 $x$ 求最小化
所以有:

$=\arg\min_{c_k}\sum_{c_k \in Y} P(y \neq c_k|X=x)$

这里的预测值 $x$ 只会属于某一个类别，因此，1减去属于某个类别的概率等价于预测值不属于其他所有类别的概率, 就可以去掉求和符 $\sum_{c_k \in Y}$ , 得到:
$\begin{aligned} f(x)&=\arg\min_{c_k}(1- P(y \neq c_k|X=x)) \\ &=\arg \max_{c_k}P(y = c_k|X=x) \end{aligned}$