朴素贝叶斯（Naive Bayes，NB）

最新推荐文章于 2024-07-28 15:37:27 发布

刘法师

最新推荐文章于 2024-07-28 15:37:27 发布

阅读量3

点赞数

文章标签：人工智能

朴素贝叶斯分类器是一种基于概率理论的监督学习算法，广泛应用于文本分类、垃圾邮件过滤和情感分析等领域。

它基于贝叶斯定理，并做出一个“朴素”假设，即特征之间相互独立。

$朴素贝叶斯（Naive Bayes，NB）_概率$

这里：

$朴素贝叶斯（Naive Bayes，NB）_监督_02$ 是后验概率，表示在观察到特征 $朴素贝叶斯（Naive Bayes，NB）_概率论_03$ 的情况下类别 $朴素贝叶斯（Naive Bayes，NB）_概率论_04$
$朴素贝叶斯（Naive Bayes，NB）_朴素贝叶斯_05$ 是似然度，表示在类别 $朴素贝叶斯（Naive Bayes，NB）_概率论_04$ 已知的情况下观察到特征 $朴素贝叶斯（Naive Bayes，NB）_概率论_03$
$朴素贝叶斯（Naive Bayes，NB）_概率_08$ 是先验概率，表示在没有其他信息的情况下类别 $朴素贝叶斯（Naive Bayes，NB）_概率论_04$
$朴素贝叶斯（Naive Bayes，NB）_概率论_10$ 是证据，表示观察到特征 $朴素贝叶斯（Naive Bayes，NB）_概率论_03$ 的总概率，它是归一化因子，确保所有可能类别的后验概率之和等于 1。

在朴素贝叶斯中，我们通常处理多个特征 $朴素贝叶斯（Naive Bayes，NB）_概率_12$ ，因此公式扩展为：
$朴素贝叶斯（Naive Bayes，NB）_监督_13$

但由于特征之间的独立性假设，我们有：
$朴素贝叶斯（Naive Bayes，NB）_概率_14$

因此公式简化为：
$朴素贝叶斯（Naive Bayes，NB）_分类_15$

在实际应用中，因为 $朴素贝叶斯（Naive Bayes，NB）_朴素贝叶斯_16$ 对所有类别来说是相同的，我们通常省略它，只关注分子部分，以确定哪个类别的后验概率最大： $朴素贝叶斯（Naive Bayes，NB）_朴素贝叶斯_17$

这里：

$朴素贝叶斯（Naive Bayes，NB）_概率_18$ 表示分类器预测的类别。
$朴素贝叶斯（Naive Bayes，NB）_朴素贝叶斯_19$ 表示选取使得括号内表达式最大的类别 $朴素贝叶斯（Naive Bayes，NB）_概率论_04$ 。

例如，如果我们正在构建一个邮件分类器，特征可能包括单词是否出现在邮件中，而类别可能是“垃圾邮件”或“非垃圾邮件”。假设我们有以下数据：

如果收到一封含有单词“赢”的新邮件，朴素贝叶斯分类器将计算两个后验概率：

分类器会比较这两个概率，并将邮件分类为具有较高后验概率的类别。这就是朴素贝叶斯算法如何工作的基本原理。

原创作者: u_15837794 转载于: https://blog.51cto.com/u_15837794/11458057

关注