算法本身
首先,上公式
贝叶斯公式:
P
(
B
∣
A
)
=
P
(
A
∣
B
)
P
(
B
)
P
(
A
)
P(B|A)=\frac{P(A|B)P(B)}{P(A)}
P(B∣A)=P(A)P(A∣B)P(B)
朴素贝叶斯假设特征向量之间是相互独立的
无需训练过程,只需要数据集,对于新的样本,只需要统计与样本相关的数据,带入公式即求得预测值
但同样的条件A下,B的各个取值的贝叶斯估计求解出的概率之和,不为1,
即:
∑
P
(
B
i
∣
A
)
≠
1
\sum P(B_i|A)\neq 1
∑P(Bi∣A)=1
这点需要注意,最终结果是要将所有的
B
i
B_i
Bi求出并选出最大的那个作为预测值
知乎 朴素贝叶斯
具体实现过程见上
相关
朴素贝叶斯在理论上是误差最小的算法,但是其有着较强的假设,实际应用中由于很可能存在着相关性,导致其效果并不好