机器学习之分类算法之朴素贝叶斯分类

本文介绍了朴素贝叶斯分类算法的基础知识,包括贝叶斯定理及其在分类问题中的应用。通过实例解释了如何计算特征属性之间的概率,并讨论了在遇到训练集中未出现的情况时,如何使用拉普拉斯修正来避免分类不合理的问题。
摘要由CSDN通过智能技术生成

最近自己对机器学习比较感兴趣,做个笔记,还请大牛不喜轻喷,多多指教。

朴素贝叶斯分类基于概率论中的贝叶斯原理:
P(A|B) = P(B|A)*P(A)/P(B)

所谓朴素即是特征属性之间相互独立的对分类结果发生影响。
所以对应的概率公式可改写为P(c|x) = P(x|c)|p(c) / P(x)
其中:

  • P(c) 是类‘先验概率’
  • P(x|c) 是样本x对于类标记c的类条件概率(或称似然)
  • P(x)叫做证据因子

由于朴素贝叶斯假定所有特征属性独立,所以

  • P(x|c)= P(x1,x2,…xn|c) = P(x1|c)P(x2|c) …P(xn|c)
  • P(x) = P(x1) * P(x2) * … * P(xn)

所以

  • P(c|x) = P(x1,x2,…xn|c) = P(x1|c)P(x2|c) …P(xn|c) * P(c) /
    p(x)。 因为 P(c) / p(x)是固定值,所以我们一般只需要计算P(x|c),找出最大似然即可

Ps:

  • 对于离散属性而言,P(x1|c) = 训练集中属性为x1且分类为c的数目|训练集中分类c的数目
  • 对于离散属性而言,一般假定其概
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值