近日在看阮一峰翻译的《黑客与画家》,书中的第8章介绍了以贝叶斯定理和推断为基础实现的一个垃圾邮件过滤器。文章对其实现过程介绍比较粗略,为此阮一峰后续还专门做了深入的研究,分别发表了两篇博文进行更深入的阐述,可见:
贝叶斯推断及其互联网应用(一):定理简介和
贝叶斯推断及其互联网应用(二):过滤垃圾邮件。理解这些文章的过程中,也顺便回顾了贝叶斯定理相关的内容。以下为个人认为的理解中需要注重的几个知识点:
联合概率:现在班上任选一人是男生并且身高在一米七以上的概率有多大&#
1. 条件概率和联合概率
抛出这个问题,一是因为它们是贝叶斯定理的基础,而是因为我突然有一天觉得它们两个好像是一回事,直到做了仔细的甄别之后......
条件概率就是事件A在另外一个事件B已经发生条件下的发生概率,表示为P(A|B),读作“在B条件下A的概率”。联合概率表示两个事件共同发生的概率,表示为P(AB)。两者关系可表现为公式:P(A|B)=P(AB)/P(B)
打个比方:假设一个班男生占40人,女生占60人,身高在一米七以上有30人,其中男生20人,女生10人。定义事件A:学生身高一米七以上,事件B:学生为男生。联合概率:现在班上任选一人是男生并且身高在一米七以上的概率有多大&#