第二章监督学习_朴素贝叶斯分类器
01 什么是朴素贝叶斯分类器
贝叶斯分类器也是一种线性模型,处理分类问题.
与之前学习过的 LogisticRegression 和 linearSVC相比,贝叶斯模型计算速度优于线性模型,泛化能力稍差.
02 贝叶斯模型分类
书中介绍3种
贝叶斯分类器名称 | 适用场合 |
---|---|
GaussinaNB | 数据样本中大多是连续数据 |
BernoulliNB | 将数据变成2分类问题,有点像线性模型,现在还看不出来区别,学习后再总结 |
MultinomialNB | 数据样本->计数统计 |
记忆技巧:
GaussinaNB :高斯纳 牛X
BernoulliNB: 伯努利 牛X
分类器的名字倒是能读出来,但让我拼写正确属实有些难度,所以建议大家再学习的时候尽量使用好一点的带函数提醒的IED.
03 伯努利算法算法说明
书上的例子:
import numpy as np
y = np.array([0, 1, 0, 1])
x = np.array([[0,1,0,1],[1,0,1,1],[0,0,0,1],[1,0,1,0]])
counts = {
}
for label in np.unique(y