统计学习方法——朴素贝叶斯（一）

最新推荐文章于 2024-08-14 22:32:50 发布

你的名字5686

最新推荐文章于 2024-08-14 22:32:50 发布

阅读量977

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/wk19951125/article/details/88575511

版权

本文介绍了朴素贝叶斯分类方法，基于贝叶斯定律和特征条件独立假设。讲解了贝叶斯定律、朴素贝叶斯的学习与分类，包括基本方法、后验概率最大化和参数估计，如极大似然估计和贝叶斯估计。并提供了分类器的表达式和学习算法流程。

摘要由CSDN通过智能技术生成

朴素贝叶斯

朴素贝叶斯

朴素贝叶斯

朴素贝叶斯是基于贝叶斯定律与特征之间条件独立这个假设的分类方法，属于生成模型。

贝叶斯定律

首先，我们给出贝叶斯定律的公式：
$P\left( { {B_i}\left| A \right.} \right) = \frac{ {P\left( { {B_i}} \right)P\left( {A\left| { {B_i}} \right.} \right)}}{ {\sum\nolimits_{j = 1}^n {P\left( { {B_j}} \right)P\left( {A\left| { {B_j}} \right.} \right)} }}$
其中 $P\left( \cdot \right)$ 为时间发生的概率， $P\left( {A\left| B \right.} \right)$ 则表示在 $B$ 发生的情况下 $A$ 发生的概率。

当特征条件独立时，则可以写为：
$P\left( {类别\left| {特征} \right.} \right){\rm{ = }}\frac{ {P\left( {特征\left| {类别} \right.} \right)P\left( {类别} \right)}}{ {P\left( {特征} \right)}}$

这里不再进行过多的赘述（我觉得知道这条就足够）。下面我们开始介绍朴素贝叶斯。

朴素贝叶斯的学习与分类

基本方法

我希望尽可能说的简单一些。

训练数据集 $\left\{ {\left( { {x_1},{y_1}} \right),\left( { {x_2},{y_2}} \right), \cdots ,\left( { {x_N},{y_N}} \right)} \right\}$ 由 $P\left( {X,Y} \right)$ 独立同分布产生。其中 $X, Y$ 分别是输入、输出空间 $\mathcal{X},\mathcal{Y}=\left\{c_1,c_2,...,c_K\right\}$ 的随机变量。

朴素贝叶斯法则是通过训练集学习联合概率分布 $P\left( {X,Y} \right)$ 。

我们看一下详细过程：

计算先验概率分布： $P\left( {Y = {c_k}} \right)，k=1,2,...,K$
计算条件概率分布： $P\left( {X = x\left| {Y = {c_k}} \right.} \right) = P\left( { {X^{\left( 1 \right)}} = {x^{\left( 1 \right)}},{X^{\left( 2 \right)}} = {x^{\left( 2 \right)}}, \cdots ,{X^{\left( n \right)}} = {x^{\left( n \right)}}\left| {Y = {c_k}} \right.} \right),k = 1,2, \cdots ,K$
意思是：在标签为 $c_k$ 时样本为 $x$ 的概率=标签为 $c_k$ 时，每个特征都取相应的取值时的概率。【计算很困难】
又因为作了特征之间条件独立的假设，所以上式可改写为为：