朴素贝叶斯为啥叫朴素

最新推荐文章于 2024-08-20 13:04:00 发布

shenzhiping12

最新推荐文章于 2024-08-20 13:04:00 发布

阅读量4k

点赞数 2

朴素贝叶斯（naive Bayes classifiers）是一种分类器，在机器学习中有着广泛的应用。相信很多人知道贝叶斯定理,即

所以，当我们有一组事件，我们想通过这组事件去估计一个事件C发生的概率，比如我们想估计水果的种类，如果有一组事件分别黄，长，弯…那我们就可以判断这是一个香蕉。尽管黄，长，弯几个事件之间可能会相互依赖，但是在朴素贝叶斯模型中，我们假设它们相互独立，这就是他的朴素之处。值得注意的是，这里的朴素对应英语单词naive，单纯的意思，所以也可以理解为很天真单纯的估计（把数据中的每个特征看作独立分布）。

OK，现在我们具体看一下朴素贝叶斯的概率模型，其实就是一个条件概率的模型，在发生的条件下去估计事件C的概率，即计算

根据贝叶斯定理，我们有

我们可以看到, 如果每个特征F的取值至少有两个，然后有100个特征，那给定一组数据后，想要计算是几乎不可能的，因为你的联合分布中有种可能，这样计算机是无法扫描完所有的概率空间的，即使可以，在会出现大量的0（即不存在的某种组合）。为了解决这个问题，我们假设所有特征F之间相互独立，这样一来，我们的等式，即可写成