统计建模:朴素贝叶斯模型

贝叶斯定理: P ( C ∣ x ) = P ( x ∣ C ) P ( C ) P ( x ) P(C|x) = \frac{P(x|C)P(C)}{P(x)} P(Cx)=P(x)P(xC)P(C)

  • x:观察变量
  • C:一个潜在特性
  • P ( C ∣ x ) P(C|x) P(Cx):后验概率
  • P ( C ) P(C) P(C):先验概率
  • P ( x ∣ C ) P(x|C) P(xC):似然性 likelihood

贝叶斯分类:最大化后验概率策略
对于具备 n 个特征的观测值 x = ( x 1 , x 2 , . . . , x n ) x=(x_1,x_2, ...,x_n) x=(x1,x2,...,xn),属于第 k 个分类的概率记为:

P ( C k ∣ x ) = P ( C k ∣ x 1 , x 2 , . . . , x n ) P(C_k|x) = P(C_k|x_1,x_2,...,x_n) P(Ckx)=P(Ckx1,x2,...,xn)

若特征间相互独立,则

P ( x i ∣ x i + 1 , . . . , x n , C k ) = P ( x i ∣ C k ) P(x_i|x_{i+1},...,x_n,C_k) = P(x_i|C_k) P(xixi+1,...,xn,Ck)=P(xiCk)

P ( x ∣ C k ) P ( C k ) = P ( x 1 ∣ C k ) P ( x 2 ∣ C k ) . . . P ( x n ∣ C k ) P ( C k ) P(x|C_k)P(C_k) = P(x_1|C_k)P(x_2|C_k) ...P(x_n|C_k)P(C_k) P(xCk)P(Ck)=P(x1Ck)P(x2Ck)...P(xnCk)P(Ck)

总体中 x 的发生概率是不变的,所以只需要寻找使分子最大的类别即可。因此朴素贝叶斯模型的关键在于计算第 k 类在总体中的先验概率以及第 k 类中观察到 X 时的条件概率。

模型描述构建模型的函数
高斯模型在每一个中都服从高斯分布(正太分布)的连续值sklearn.native_bayes.GaussianNB
Multinomial(多项式)模型 x i x_i xi:特征 i i i 发生的频次; x x x:n个特征的直方图sklearn.native_bayes.MultinomiaNB
Bernoulli(伯努利)模型 x i x_i xi:特征 i i i 发生 / 不发生; x x x:n 个特征发生与否的二进制序列sklearn.native_bayes.BernoulliNB
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值