贝叶斯分类法,对于待分类项x,计算x出现的条件下各个类别出现的概率,哪个类别出现的概率最高,则x就属于哪个类别。即,计算x属于哪个类别的概率最高。
各个类别出现的概率根据贝叶斯公式进行计算。
例如,x出现时,类别c出现的概率(即x属于类别C的概率)为:p(c|x)=p(x|c)P(c)/p(x)
等号右边的分母项对于所有类别都相同,可以忽略;故只需求得max(p(c|x));而p(x|c)和p(c)可以由训练集计算可得。
总的来说,贝叶斯分类就是:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
举例如下:
求接下来的一天是否适合去打球:
学习过程:
Outlook | Play=Yes | Play=No |
Sunny | 2/9 | 3/5 |
Overcast | 4/9 | 0/5 |
Rain | 3/9 | 2/5 |
Temperature | Play=Yes | Play=No |
Hot | 2/9 | 2/5 |
Mild | 4/9 | 2/5 |
Cool | 3/9 | 1/5 |
Humidity | Play=Yes | Play=No |
High | 3/9 | 4/5 |
Normal | 6/9 | 1/5 |
•
决策阶段
–
给定一个待分类的一天,
x’=(Outlook=Sunny, Temperature=Cool,Humidity=High, Wind=Strong)
–
查找表