朴素贝叶斯模型,全称为:Naive Bayesian Model,Naive 能翻译为朴素,已经是很高看它了,因为我们知道naive的含义如下:
naive: marked by or showing unaffected simplicity and lack of guile or worldly experience;
它是简单的,它是缺乏worldly experience的。
正如它的名字一样,朴素贝叶斯模型假设样本特征彼此独立,没有相关关系。正如我们所知,这个假设在现实世界中是很不真实的,因此,说朴素贝叶斯真的很“朴素”。
但,朴素贝叶斯模型就没用了吗? 不是的。这个假设现实中基本上不存在, 但特征相关性很小的实际问题还是很多的, 所以这个模型仍然能够工作得很好。
关于朴素贝叶斯的详细例子解释和实战,大家可参考公众号界面的菜单:
下面是朴素贝叶斯的例子解释。
假如我是一个质检员,现在接到了三箱零件需要检验,其中第一箱有10个零件,第二箱有20个零件,第三箱有15个。半小时过去了,检验的结果出炉,第一箱有1个不合格,第二箱有3个不合格,第三箱2个不合格。
下午领导要来视察了,看看我验的货到底有没有问题,于是他随手拿了一个零件,我心里默默计算,领导拿到这个件为合格件的概率有多大?
在这个问题中,领导拿的这个零件首先一定在这3个箱子中的某一个,因此样本空间可以由这3个箱子组成,记 Ai 为从第i个箱子拿的零件,i的取值范围为1,2,3。然后再用一个事件来标记拿到正品,记为B,因此,领导拿到这个件为合格件的概率ÿ