在已知X的各属性的情况下求所属的类别Y–假设有Y1、Y2两类,那么就求分别在Y1的情况下,属性是X的选择属性的概率,同理,然后比较Y1和Y2下,概率的大小。选择概率大的。—各个属性 P(a1,a2,a3|Y) = P(a1|Y) * P(a2|Y) * P(a3|Y)
假设各个特征属性是条件独立的。
朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
关键就是如何计算第3步中的各个条件概率:
1、找到一个已知分类的待分类项集合,这个集合叫做训练样本集。
2、统计得到在各类别下各个特征属性的条件概率估计。
3、如果各个特征属性是条件独立的,则根据贝叶斯定理有如下推导:
因为分母对于所有类别为常数,因为我们只要将分子最大化皆可。又因为各特征属性是条件独立的,所以有: