朴素贝叶斯

朴素贝叶斯是一种基于贝叶斯定理的分类方法,假设特征之间相互独立。它在处理文本分类和垃圾邮件过滤等问题时,通过计算先验和后验概率来预测类别。当遇到概率为0的情况,拉普拉斯平滑用于修正这个问题,通过分子加一和分母加特征数量来避免零概率。这种方法在小样本情况下也能有效防止概率估计过于敏感。
摘要由CSDN通过智能技术生成

朴素贝叶斯(Naive Bayes )概述:
其为基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单
数学知识要求:
先验概率、后验概率、条件概率、贝叶斯公式、条件独立假设(准备充分的话可以考虑多学1个全概率公式)
联合概率举列子:
P(年龄,收入,婚姻|买) = P(年龄|买) * P(收入|买)*P(婚姻|买)
拉普拉斯平滑系数:
在这里插入图片描述

  1. 解决问题: 某些特征的概率P为0的情况,无论是在全文检索中某个字出现的概率,还是在垃圾邮件分类中,这种情况明显是不太合理的。
  2. 理论假设:假定训练样本很大时,每个分量x的计数加1造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题
  3. 举例:假设在文本分类中,有3个类:C1、C2、C3。在指定的训练样本中,某个词语K1,在各个类中观测计数分别为0,990,10。则对应K1的概率为0,0.99,0.01。于是对这三个量使用拉普拉斯平滑的计算方法如下:1/1003 = 0.001,991/1003=0.988,11/1003=0.011
  4. 总结:分子加一,分母加K,K代表类别数目。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值