朴素贝叶斯分类
在数据稀疏的情况下准确率依旧较高,可适用于多分类。用于标称型数据(离散型)。
实质:通过样本属性值在每个类别的概率,计算输入数据在每个类别的概率,取其概率最大的为样本类别。
总结
朴素贝叶斯流程:
1.计算样本中每个属性值在该类别上的条件概率P(xi|c)
2.根据输入数据的属性值对计算好的概率(分类别)做乘法运算(如将属性值对应的概率相乘)计算属性在该类别上的联合概率P(x|c)
为什么分类别计算:每个类别对应的该属性值的条件概率都不同
这里指定的将要进行分类的数据的属性,其属性必然只存在一个值。将对应其值的P(xi|c)分