ML—朴素贝叶斯

最新推荐文章于 2023-05-27 12:31:00 发布

掉下个小石头

最新推荐文章于 2023-05-27 12:31:00 发布

阅读量1.2k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/zhangzhengyi03539/article/details/50267829

版权

机器学习专栏收录该内容

32 篇文章 2 订阅

订阅专栏

华电北风吹
日期：2015/12/12

朴素贝叶斯算法和高斯判别分析一样同属于生成模型。但朴素贝叶斯算法需要特征条件独立性假设，即样本各个特征之间相互独立。

一、朴素贝叶斯模型
朴素贝叶斯算法通过训练数据集学习联合概率分布 $p(x,y),其中x=(x_1,x_2,...,x_n) \in R^n,y\in R$ 。具体的对于K分类问题就是需要学习一个类别的先验概率分布 $p(y=c_k),k=1,2,...,K$ 和每个类别下的条件概率分布(如式1-1)
$p(x|y)=p(x_1,x_2,...,x_n|y) \tag{1-1}$
由于朴素贝叶斯算法没有假设特征的分布，因此需要将每个特征量化为离散型变量，然后学习各个特征水平下的条件概率。如果各个特征 $x_i$ 被分别量化为 $S_i$ 个水平，那么共有 $K+K\prod_{i=1}^{n}{S_i}$ 个需要学习的参数。
但是，为了使朴素贝叶斯算法变得简单点—主要是减少参数个数，就强加了一个条件概率分布的独立性假设(具体如式1-2)
$p(x|y)=p(x_1,x_2,...,x_n|y)=\prod_{i=1}^{n}{P(x_i|y)} \tag{1-2}$
这样需要学习的参数个数就变为 $K+K\sum_{i=1}^{n}{S_i}$ 个，大大的简化了模型。

二、朴素贝叶斯参数估计
在条件独立性假设下，贝叶斯模型的参数学习就简化为类别先验概率 $p(y=c_k)$ 和条件概率 $p(x_i|y)$ 的学习。

1、极大似然估计
对于训练数据集 $(x^{(i)},y^{(i)}),x^{(i)}\in R^n,y^{(i)}\in R$ ，似然函数如下,
$L(\phi_y,\phi_{x|y})=\prod_{i=1}^{m}{p(x^{(i)},y^{(i)})}=\prod_{i=1}^{m}{p(y^{(i)})\prod_{j=1}^{n}p(x_j^{(i)}|y^{(i)})} \tag{2-1}$
结合 $\sum_{y}{\phi_y}=1$ 以及 $\sum_{}^{S_i}p(x_{i}|y)=1$ ,可以容易得到下式(简单的求偏导即可，两式均是)：
$\phi_{y=k}=\frac{\sum_{i=1}^{m}1\{y^{(i)}=k\}}{m}\tag{2-2}$
$\phi_{x_i=j|y=k}=\frac{\sum_{i=1}^{m}1\{y^{(i)}=k \bigcap x_i=j\}}{\sum_{i=1}^{m}1\{y^{(i)}=k\}}\tag{2-3}$

2、古德-图灵估计
主要用于解决统计样本不足的概率估计问题，主要思想是在统计中相信可靠的统计数据，而对不可信的统计数据打折扣的一种概率估计方法，同时将折扣出来的那一小部分概率给予为看见的事件。

3、贝叶斯估计(拉普拉斯光滑)
在公式2-2和2-3中，会出现分子分母同为0的情况。解决这种情况的方案如下：
$\phi_{y=k}=\frac{\sum_{i=1}^{m}1\{y^{(i)}=k\}+\lambda}{m+K\lambda}\tag{2-4}$
$\phi_{x_i=j|y=k}=\frac{\sum_{i=1}^{m}1\{y^{(i)}=k \bigcap x_i=j\}+\lambda}{\sum_{i=1}^{m}1\{y^{(i)}=k\}+S_j\lambda}\tag{2-5}$
其中 $\lambda\geq 0$ .一般取 $\lambda=1$ 。

三、朴素贝叶斯决策方法—最大后验概率
对于测试数据 $x\in R^n$ ，朴素贝叶斯模型采用贝叶斯规则决策，具体表述如下：
$p(y|x)=arg\max_k p(y=k)p(x|y=k)$
采用后验概率最大的类别作为模型输出类别。

现在仔细想想感觉朴素贝叶斯跟k-means逻辑上的思路还是比较接近的。

掉下个小石头

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
ML—朴素贝叶斯

华电北风吹日期：2015/12/11朴素贝叶斯算法和高斯判别分析一样同属于生成模型。但朴素贝叶斯算法需要特征条件独立性假设，即样本各个特征之间相互独立。一、朴素贝叶斯模型图示其中，C1，C2,…,Ck表示k个类别的先验概率，pi1,pi2,…,pin表示如图所示，对于k分类问题，贝叶斯算法需要构建k个联合概率分布。二、朴素贝叶斯模
复制链接

扫一扫