贝叶斯分类器是一种简单有效的常用分类算法,我们这里想通过一个简单的例子讲一下朴素贝叶斯分类器的原理。
比如说,学校开设的一门课程,我想通过几个同学的学习情况知道这些同学能否通过这门考试,我们选择如下一组数据集,在表中我们选择了和“考试通过”这个事件可能相关的三个事件“听课”“完成作业”“认真复习”,并列出了它们的一组数据。
考试通过 | 听课 | 完成作业 | 认真复习 |
---|---|---|---|
1 | 1 | 1 | 1 |
1 | 1 | 0 | 1 |
1 | 0 | 1 | 1 |
1 | 1 | 1 | 0 |
0 | 0 | 0 | 0 |
0 | 1 | 0 | 0 |
1 | 0 | 0 | 1 |
0 | 0 | 1 | 0 |
现在根据这组数据,一位想知道,他只想听课和写作业,考前不复习,能不能通过这门考试?
现在我们要解决这样一个概率模型,先要引入概率的一些定义,首先我们把“考试通过”设为事件X,将“听课”设为事件A,“完成作业”设为事件B,“认真复习”设为事件C,将发生概率表示为P。
从上面的列表中我们可以发现,一共有8个样本,我们可以求出考试通过的概率,也