朴素贝叶斯
最小错误率贝叶斯<=>最大后验分类规则:
w
∗
=
a
r
g
m
a
x
{
P
(
w
i
∣
x
)
}
w^{*}=argmax\left \{P(w_{i}|x)\right \}
w∗=argmax{P(wi∣x)} =
a
r
g
m
a
x
{
P
(
x
∣
w
i
)
P
(
w
i
)
}
argmax\left \{P(x|w_{i})P(w_{i})\right \}
argmax{P(x∣wi)P(wi)}
1. 朴素贝叶斯核心理解
对已知类别,假设所有属性相互独立。换言之,假设每个属性独立地对分类结果发生影响,那么得出朴素贝叶斯核心假设:
朴素贝叶斯判决规则: w ∗ = a r g m a x { ∏ k = 1 K P ( x ∣ w i ) P ( w i ) } w^{*}=argmax\left \{\prod_{k=1}^{K}P(x|w_{i})P(w_{i})\right \} w∗=argmax{∏k=1KP(x∣wi)P(wi)}
Eg: 用个例子来辅助理解:
解答:
2. 拉普拉斯平滑处理
Q1: 回看到上述例子,发现一个问题,若将测试改成 “云 热 高 是”, 那么就如下图所示:
发现只要因子出现了0,不管后面是什么情况、什么条件,最后得到的结果仍旧是0(假设w=0,得到的结果为0),那就肯定会选择w=1,选择打网球,不管此时环境有多恶劣,这就是所谓的 Zero-Frequency Problem。
解决方法:使用拉普拉斯平滑处理
具体用法如下:
类
型
=
{
拉
普
拉
斯
平
滑
α
=
1
L
i
d
s
t
o
n
e
平
滑
0
≤
α
<
1
类型 =\left\{\begin{matrix} &拉普拉斯平滑 &\alpha =1 \\ &Lidstone平滑 &0\leq \alpha < 1 \end{matrix}\right.
类型={拉普拉斯平滑Lidstone平滑α=10≤α<1