机器学习数学原理(4)——朴素贝叶斯模型
朴素贝叶斯模型(Naive Bayes Model),是一种基于贝叶斯定理与特征条件独立假设的分类方法,与决策树模型(Decision Tree Model)同为目前使用最广泛的分类模型之一,在各个领域都有广泛的应用,例如我们经常会用到的垃圾邮件的分类功能。
这篇博文接上一篇博文:机器学习数学原理(3)——生成型学习算法。但又有其相对的独立性与重要性,故笔者重新开一篇博文来介绍。老规矩,由于笔者能力有限,如果有任何不妥甚至错误的地方,欢迎批评指出。
1 朴素贝叶斯模型简介
上百科搜了搜,摘抄下面一段,权当补充一下知识吧…
贝叶斯定理这个在250多年前发明的算法,在信息领域内有着无与伦比的地位。贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素贝叶斯算法(Naive Bayesian)是其中应用最为广泛的分类算法之一。
如果读者读了上一篇博文可以知道,上一篇博文详细讲述的GDA(高斯判别算法)的特征向量为连续的随机变量。不同于GDA的这个特点,朴素贝叶斯模型的特征向量主要是离散的,如果有连续的,可以通过划分范围来使其离