贝叶斯定理:
这个地方一般都很清晰,没人闹不明白这个
则根据贝叶斯定理有如下推导:
到这儿,就有点容易让人蒙圈。因为我们知道,概率里面p(x)是对x这个值的所在集合,求概率。但是这个地方不是,p(x|yi)中的
x,不是一个集合,而是一个联合分布。不是P(x)=P(x1)+..P(xi),而是P(x)=P(x1,x2,..,xi)=P(x1)*P(x2)...*P(xi).这里就是关键。
换成通俗的说法,就是在一封垃圾邮件中,开发票,公司,保税,来电,这些词共同出现的概率,等于它们各自出现概率的乘积,而非加和。
故有:
到这里,应该已经没什么问题了