朴素贝叶斯(Naive Bayes)
朴素贝叶斯定义介绍
优点:朴素贝叶斯是基于贝叶斯公式得到的,它有着牢固的数学基础,所以也拥有可靠的分类性能,例如邮件的分类,从中筛选掉垃圾邮件这样的应用中有着朴素贝叶斯分类的影子。
缺点:此模型所需的参数很少,对数据集参数缺失不敏感。
贝叶斯公式
𝑝(𝐴|𝐵)=𝑝(𝐴,𝐵)/𝑝(𝐵)=𝑝(𝐵|𝐴)⋅𝑝(𝐴)/(∑𝑎∈ℱ𝐴𝑝(𝐵|𝑎)⋅𝑝(𝑎))
其中:
p(A,B):表示事件A和事件B同时发生的概率。
p(B):表示事件B发生的概率,叫做先验概率;p(A):表示事件A发生的概率。
p(A|B):表示当事件B发生的条件下,事件A发生的概率叫做后验概率。
p(B|A):表示当事件A发生的条件下,事件B发生的概率。
这也可以用文字理解为:
后验概率 = (似然度 * 先验概率)/标准化常量 也就是说,后验概率与先验概率和似然度的乘积成正比。