一、学习朴素贝叶斯之前先了解一下 条件概率下 贝叶斯公式
1、举例是两个机床M1和M2 用例生产扳手
机器 | 生产扳手(个数 ) |
Mach1 | 30 |
Mach2 | 20 |
不合格占1%(
defective)
机器 | 次品分布比例() |
Mach1 | 50% |
Mach2 | 50% |
2、问题:
Mach2生产的不合格产品的概率是多少?
P(Mach1)=30/50 = 0.6
P(Mach2)=20/50 = 0.4
P(Defect)=1%
P(Mach1|Defect)= 50%
P(Mach2|Defect)= 50%
P(Defect|Mach2)= ?
根据条件概率 贝叶斯法则
P(A|B) : 在事件B发生的条件下A发生的概率
P(B|A) : 在事件A发生的条件下B发生的概率
P(A) :A 单独发生的概率
P(B) :B 单独发生的概率单独发生的概率
P(Defect|Mach2)= (P(Mach2|Defect)* P(Defect))/ P(Mach2)
= (0.5*0.1)/0.4 = 0.125
二、朴素贝叶斯
1.根据薪资和年龄的对30个人进行了分类(打标签)
2.假设分类标签为上班的交通方式:
步行(Walks)、开车(Drives)
,那新加入一个员工(new data point)是什么是属于那个类或者那种方式上班?
3、利用贝叶斯法则(公式)
4、P(Walks)=10/30 (
已知的先验概率
)
5、P(X)=4/30 (
在步行的情况下观测到X的概率(下图画一个圈,覆盖一个范围,有4个人,这个范围里面有开车和有步行,步行的有3个,开车的1个,这个半径大小和调优有关系,现在不考虑大小
)
6、P(X|Walks)=3/10 (X
在步行人中的概率,Walks=10
)
7、代入公式求值:这个人步行的概率是0.75
8、问题(作业),这个人开车概率是多少?
P(Drives)=20/30 (
已知的先验概率
)
P(X)=4/30
P(X|Drives)=1/20
P(Drives|X) =( P(X|Drives)* P(Drives))/P(X) = ( 1/20 *20/30 )/(4/30) = 0.25