大家好,本文将围绕朴素贝叶斯算法实例代码展开说明,朴素贝叶斯算法代码实现是一个很多人都想弄明白的事情,想搞清楚朴素贝叶斯算法的作用需要先了解以下几个事情。
朴素贝叶斯
1.简介
贝叶斯分类算法是统计学中的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。其分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率作为该特征所属的类chat gpt4.0能用来写作吗。
之所以称之为“朴素”,是因为贝叶斯分类只做最原始、最简单的假设:所有的特征之间是相对独立的。
2.数学基础
2.1相对独立
假设X有x1,x2,…xn个特征,P(x) = P(x1)P(x2)…P(xn)
2.2条件概率
假设有A,B两个事件,在B事件发生的条件下,A事件发生的概率。
P ( A ∣ B ) = P ( A B ) P ( A ) P(A|B)=\frac{P(AB)}{P(A)} P(A∣B)=P(A)P(AB)
2.3全概率公式(从原因到结果)
考察在每一种情况下事件A发生的概率,计算A的概率。
P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=\sum_{i=1}^{n} P(A_{i} )P(B|A_{i} ) P(B)=i=1∑nP(Ai)P(B∣Ai)
公式表示若事件A1,A2,…,An构成一个完备事件组且都有正概率,则对任意一个事件B都有公式成立。
2.4贝叶斯公式(从结果到原因)
在事件A发生的条件下,考察每种情况出现的条件概率
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ∣ A ) P ( A ) + P ( B ∣ A ′ P ( A ′ ) ) P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|A^{'} P(A^{'} ))} P(A∣B)=P(B∣A)P(A)+P(B∣A′P(A′))P(B∣A)P(A)
其中样本空间由A和A’组成。
3.算法原理
3.1朴素贝叶斯公式推导
由条件概率公式:
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A)=\frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB)
可以推导出:
P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(B∣A)P(A)
同理可得:
P ( A B ) = P ( A ∣ B ) P ( B ) P(AB)=P(A|B)P(B) P(AB)=P(A∣B)P(B)
由于(5)和(6)相等:
P ( B ∣ A ) P ( A ) = P ( A ∣ B ) P ( B ) P(B|A)P(A)=P(A|B)P(B) P(B∣A)P(A)=P(A∣B)P(B)
可以推出贝叶斯公式:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=\frac{P(B|A)P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)P(A)
3.2公式分析
P(A):为先验概率,即在B事件发生之前,对A事件发生概率的预判。
P(A|B):为后验概率,即在B事件发生之后,对A事件发生概率的重新评估。
P(B|A)/P(B):为可能性函数,是一个调整因子,使得预估概率更加接近真实概率。
所以贝叶斯公式可以表示为:后验概率=先验概率 * 调整因子
如果调整因子>1,则表示先验概率被增强,事件A发生的可能性变大。
如果调整因子=1,则表示事件B对判断事件A发生的概率没有帮助。
如果调整因子<1,则表示先验概率被削弱,事件A发生的可能性变小。
注意:用朴素贝叶斯算法对案例进行分类时,主要是通过求分类目标的最大后验概率来进行分类。由于在同种情况下贝叶斯公式的分母是相同的,所以在计算是可以将分母忽略,以减少计算。
y = a r g m a x P ( y ) ∏ i = 1