【机器学习】02-朴素贝叶斯学习笔记

最新推荐文章于 2022-01-25 11:01:33 发布

水花

最新推荐文章于 2022-01-25 11:01:33 发布

阅读量382

点赞数

分类专栏：机器学习文章标签：机器学习算法

本文链接：https://blog.csdn.net/weixin_43849871/article/details/105718105

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

1. 朴素贝叶斯的理论基础

朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。

1.1 贝叶斯定理

先看什么是条件概率。

$P (A ∣ B)$ 表示事件B已经发生的前提下，事件A发生的概率，叫做事件B发生下事件A的条件概率。其基本求解公式为： $P (A ∣ B) = P (A B) P (B) P (A ∣ B) = P (A B) P (B)$
贝叶斯定理便是基于条件概率，通过 $P (A ∣ B) 来求 P (B ∣ A)$ ：

$P (B ∣ A) = P (A ∣ B) P (B) P (A) P (B ∣ A) = P (A ∣ B) P (B) P (A)$
顺便提一下，上式中的分母P(A),可以根据全概率公式分解为：

$P(A)=\sum_{i=1}^{n}P(B_i)P(A|B_i)$

1.2 特征条件独立假设

这一部分开始朴素贝叶斯的理论推导，从中你会深刻地理解什么是特征条件独立假设。

给定训练数据集（X,Y），其中每个样本x都包括n维特征，即x=(x1,x2,x3,…,xn)x=(x1,x2,x3,…,xn)，类标记集合含有k种类别，即y=(y1,y2,…,yk)y=(y1,y2,…,yk)。

$P (y k ∣ x) = P (x ∣ y k) P (y k) P (x) P (y k ∣ x) = P (x ∣ y k) P (y k) P (x)$
根据全概率公式，可以进一步地分解上式中的分母：

$P(yk|x)=\frac{P(x|yk)P(yk)}{\sum_{k}P(x|yk)P(yk)P(yk|x)}=P(x|yk)P(yk)\sum_{k}P(x|yk)P(yk)$ 【公式1】

先不管分母，分子中的P(yk)P(yk)是先验概率，根据训练集就可以简单地计算出来。

而条件概率P(x|yk)=P(x1,x2,…,xn|yk)P(x|yk)=P(x1,x2,…,xn|yk)，它的参数规模是指数数量级别的，假设第i维特征xixi可取值的个数有SiSi个，类别取值个数为k个，那么参数个数为：k∏ni=1Sik∏i=1nSi
这显然不可行。针对这个问题，朴素贝叶斯算法对条件概率分布作出了独立性的假设，通俗地讲就是说假设各个维度的特征x1,x2,…,xnx1,x2,…,xn互相独立，在这个假设的前提上，条件概率可以转化为：

$P (x ∣ y k) = P (x 1, x 2, . . ., x n ∣ y k) = \prod n i = 1 P (x i ∣ y k) P (x ∣ y k) = P (x 1, x 2, . . ., x n ∣ y k) = \prod i = 1 n P (x i ∣ y k)$ 【公式2】

这样，参数规模就降到 $\sum_{i=1}^{n}Sik$
以上就是针对条件概率所作出的特征条件独立性假设，至此，先验概率P(yk)P(yk)和条件概率P(x|yk)P(x|yk)的求解问题就都解决了，那么我们是不是可以求解我们所要的后验概率P(yk|x)P(yk|x)了？

水花

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【机器学习】02-朴素贝叶斯学习笔记

1. 朴素贝叶斯的理论基础朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。1.1 贝叶斯定理先看什么是条件概率。P(A∣B)P(A|B)P(A∣B)表示事件B已经发生的前提下，事件A发生的概率，叫做事件B发生下事件A的条件概率。其基本求解公式为：P(A∣B)=P(AB)P(B)P(A∣B)=P(AB)P(B)P(A|B)=P(AB)P(B)P(A|B)=P(AB)P(B)P...
复制链接

扫一扫