概率和似然的区别:https://blog.csdn.net/songyu0120/article/details/85059149
极大似然估计:https://zhuanlan.zhihu.com/p/26614750
极大似然估计中采样需满足一个重要的假设,就是所有的采样都是独立同分布的
详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解:
https://blog.csdn.net/u011508640/article/details/72815981
贝叶斯估计、最大似然估计、最大后验概率估计(概念更加齐全):
https://www.jianshu.com/p/9c153d82ba2d
贝叶斯分类器
朴素贝叶斯
垃圾邮件分类:
建立两个BoW(Bag of Word),正常邮件词袋,垃圾邮件词袋。计算词袋内部词语的概率Pw。
计算出现正常邮件和垃圾邮件的概率Pn和Ps
对于某一句话进行估计,计算其是正常邮件和垃圾邮件分别的概率。
Ppredict_normal = Pn x Pwi_in_normal (Pwi_in_normal指的是这句话中所有词语在正常邮件词袋中的概率相乘)
Ppredict_spam = Ps x Pwi_in_spam