2020-11-30 是否要采用朴素贝叶斯(1)
朴素贝叶斯
解释下称其为朴素贝叶斯的原因:因为他假定所有的属性都是相互独立。
朴素概率分为两种:
- 关于类别概率P(Cj)
- 关于属性的条件概率P(Ai|Cj)
类别概率就是每个类在总体中的概率,举个例子:
假设我有 7 个棋子,其中 3 个是白色的,4 个是黑色的。那么棋子是白色的概率就是 3/7,黑色的概率就是 4/7,这个就是类别概率。
条件概率就是P(A|B),举个例子:
假设我把这 7 个棋子放到了两个盒子里,其中盒子 A 里面有 2 个白棋,2 个黑棋;盒子 B 里面有 1 个白棋,2 个黑棋。那么在盒子 A 中抓到白棋的概率就是 1/2,抓到黑棋的概率也是 1/2,这个就是条件概率,也就是在某个条件(比如在盒子 A 中)下的概率。
训练朴素贝叶斯,就是要算出上述的两种分类,所以要给出数据和数据所属于的分类,也就是说我们要先给出一定的量来作为训练集。计算出结果后,就可以使用这个模型对新数据进行分类。
但是特征向量只有7个 用简单的判断,手动穷举完全可以解决,明天再看看