朴素贝叶斯分类器

朴素贝叶斯分类器

朴素贝叶斯分类器是基于贝叶斯定理与特征条件独立假设的分类方法,是一种从概率框架出发的生成模型
监督学习假设输入与输出的随机变量 X X X Y Y Y遵循一个联合概率分布 P ( X , Y ) P(X,Y) P(X,Y), 这个分布存在且未知,训练数据与测试数据被看作是依照该联合概率独立同分布产生的。朴素贝叶斯法便是通过统计训练数据集估计联合概率分布 P ( X , Y ) P(X,Y) P(X,Y)

基本思路

估计 P ( X , Y ) P(X,Y) P(X,Y)的具体方法为,估计先验概率分布 P ( Y ) P(Y) P(Y)条件概率分布 P ( X ∣ Y ) P(X|Y) P(XY) ,通过公式
P ( Y ∣ X ) = P ( X , Y ) P ( X ) = P ( Y ) P ( X ∣ Y ) P ( X ) P(Y|X) = \frac{P(X,Y)}{P(X)}=\frac{P(Y)P(X|Y)}{P(X)} P(YX)=P(X)P(X,Y)=P(X)P(Y)P(XY)
得到后验概率 P ( Y ∣ X ) P(Y|X) P(YX)
直观一点后验概率可以理解为,当给定一个样本 x x x时, x x x属于某个类的概率。那么,分类器只需要把概率最高的那个类作为分类结果即可。所以贝叶斯分类器就选择使后验概率最大的那个类别 c c c作为输出,即分类决策函数 f ( x ) f(x) f(x)写做:
f ( x ) = arg ⁡ max ⁡ c ∈ Y P ( c ∣ x ) = arg ⁡ max ⁡ c ∈ Y P ( c ) P ( x ∣ c ) P ( x ) \begin{aligned} f(x) &= \mathop {\arg\max}_{c \in Y} P(c|x) \\ &=\mathop {\arg\max}_{c \in Y} \frac{P(c)P(x|c)}{P(x)} \end{aligned} f(x)=argmaxcYP(cx)=argmaxcYP(x)P(c)P(xc)
式中 P ( x ) P(x) P(x)与类标无关,对于所有可能的类都是相同的值,所以 f ( x ) f(x) f(x)可以写为:
f ( x ) = arg ⁡ max ⁡ c ∈ Y P ( c ) P ( x ∣ c ) f(x)=\mathop{\arg\max}_{c \in Y} P(c)P(x|c) f(x)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值