机器学习经典算法-贝叶斯学习之朴素贝叶斯分类器

最新推荐文章于 2024-08-14 22:32:50 发布

kedixa

最新推荐文章于 2024-08-14 22:32:50 发布

阅读量1.4k

点赞数 1

分类专栏：算法机器学习文章标签：机器学习算法贝叶斯分类器

本文链接：https://blog.csdn.net/liuwenshanqq/article/details/50429722

版权

算法同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

机器学习

3 篇文章 0 订阅

订阅专栏

简介

贝叶斯推理提供了一种概率手段。它基于如下的假定，即待考查的量遵循某概率分布，且可根据这些概率及已观察到的数据进行推理。（机器学习 Tom M. Mitchell）

朴素贝叶斯分类器在某些领域内性能可以与神经网络和决策树学习相当。

贝叶斯定理

$P(A)$ 表示事件A发生的概率， $P(A|B)$ 表示事件B发生的情况下事件A发生的概率

P (A | B) = P ( A B ) P ( B )

$P(A|B) = \frac{P(AB)}{P(B)}$

贝叶斯公式：

P (B | A) = P ( A | B ) P ( B ) P ( A )

$P(B|A) = \frac{P(A|B)P(B)}{P(A)}$

朴素贝叶斯

朴素贝叶斯分类的目的是要在给定实例的属性值 <a1,a2,…,an> <script type="math/tex" id="MathJax-Element-4432"> </script> 的情况下，得到最可能的目标属性值

v M A P = a r g max v j \in V P (v j | a 1, a 2, \dots, a n) = a r g max v j \in V P ( a 1 , a 2 , \dots , a n | v j ) P ( v j ) P ( a 1 , a 2 , \dots , a n ) = a r g max v j \in V P (a 1, a 2, \dots, a n | v j) P (v j)

$\begin{align} v_{MAP} &= arg \max \limits_{v_j \in V} P(v_j | a_1, a_2, \dots, a_n)\\ &= arg\max \limits_{v_j \in V}\frac{P(a_1, a_2, \dots, a_n| v_j)P(v_j)}{P(a_1, a_2, \dots, a_n)}\\ &=arg\max \limits_{v_j \in V}P(a_1, a_2, \dots, a_n| v_j)P(v_j) \end{align}$
其中

argmaxf(x) $argmax f(x)$ 表示使得

f(x) $f(x)$ 函数值最大的

x $x$ 的值，所以最后一步可以去掉分母。

朴素贝叶斯分类器假定每个属性值之间相互条件独立，所以

P (a 1, a 2, \dots, a n | v j) = \prod i P (a i | v j)

$P(a_1, a_2, \dots, a_n|v_j) = \prod_i P(a_i | v_j)$

朴素贝叶斯分类器：

v N B = a r g max v j \in V P (v j) \prod i P (a i | v j)

$v_{NB} = arg\max \limits_{v_j \in V} P(v_j) \prod_i P(a_i | v_j)$

其中 $P(v_j), P(a_i|v_j)$ 需要在训练数据集上学习。

本文数据集（出自机器学习Tom M.Mitchell）如下：

Outlook	Temperature	Humidity	Wind	PlayTennis
Sunny	Hot	High	Weak	No
Sunny	Hot	High	Strong	No
Overcast	Hot	High	Weak	Yes
Rain	Mild	High	Weak	Yes
Rain	Cool	Normal	Weak	Yes
Rain	Cool	Normal	Strong	No
Overcast	Cool	Normal	Strong	Yes
Sunny	Mild	High	Weak	No
Sunny	Cool	Normal	Weak	Yes
Rain	Mild	Normal	Weak	Yes
Sunny	Mild	Normal	Strong	Yes
Overcast	Mild	High	Strong	Yes
Overcast	Hot	Normal	Weak	Yes
Rain	Mild	High	Strong	No

使用上表的数据分类以下实例：

< O u t l o o k = S u n n y, T e m p e r a t u r e = C o o l, H u m i d i t y = H i g h, W i n d = S t r o n g >

v N B = a r g m a x v j \in {y e s, n o} P (v j) \prod i P (a i | v j) = a r g m a x v j \in {y e s, n o} P (v j) P (S u n n y | v j) P (C o o l | v j) P (H i g h | v j) P (S t r o n g | v j)

$\begin{align} v_{NB} &= \underset{v_j \in \{yes, no\}}{argmax} P(v_j)\prod_iP(a_i|v_j)\\ &= \underset{v_j \in \{yes, no\}}{argmax} P(v_j) P(Sunny|v_j)P(Cool|v_j)P(High|v_j)P(Strong|v_j) \end{align}$
为了表达简便，省略了属性名称。根据数据集，可以很容易地得到：