其主要陈述的是在通过A条件下B发生的概率(即P(B|A))来求解B条件下A发生的概率(即P(A|B))。
其基本公式如下:
朴素贝叶斯的思想基础是:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
一,符号约定:
x={a_1,a_2,…,a_m}
为一个待分类项,而a为x的一个特征属性;
C={y_(1,) y_(2,)…,y_n}
为类别的集合,P(y_i )为各个类别的先验概率
p(a_j│y_i )
表示在类别y_i条件下特征a_j出现的频率
二,按照nbays的思想基础其求解目标如下:
即在属性x的条件下,属于y的概率,并取概率的最大值作为最终的分类结果。
三,对于p(y_i│x)可以通过如下公式求解:
上式中p(y_i)表示整体样本属于y_i的概率,p(x)为属性x出现的频率,这两者比较容易求出,关键是p(x│y_i )即在分类y_i的条件下属性x出现的概率,
四,由于各个属性是条件独立的,因此可以通过如下公式求解p(x│y_i )的值:
其中p(a_j│y_i )表示在类别y_i的条件下特征a_i出现的频率。这个频率比较容易求出。
这样就能够获得最终的分类结果了。