朴素贝叶斯模型

朴素贝叶斯模型基于贝叶斯公式这里写图片描述
来估计后验概率这里写图片描述 ,但是整个公式里最困难的部分就是对这里写图片描述 的估计。可以分为下面几种情况来进行讨论。

–基于属性条件独立性假设

这里写图片描述
对后验概率的估计可写为这里写图片描述
由于分布对所有的c来讲都是相同的,所以对样本x的分类是取决于分子的大小的。
离散属性
这里写图片描述
这里写图片描述
连续属性
对于连续属性,可以考虑概率密度函数,假定这里写图片描述 其中这里写图片描述这里写图片描述 分别代表的是第c类样本在第i个属性上取值的均值和方差。
这里写图片描述
需注意,若某个属性值在训练集中没有与某个类同时出现过,那么直接基于属性独立性而连乘进行概率估计,那么后验概率进行的判别也会出现问题,连乘式为0,那么无论该样本的其他属性是什么,分类结果则直接为0,导致其他属性携带的信息被训练集中未出现的属性值“抹去”,因此为了避免这种情况的出现,在估计概率值时需要进行平滑,而常用的平滑方法有“拉普拉斯修正”,具体来说,令N表示训练集D中可能的类别数,Ni表示第i个属性可能的取值数。根据拉普拉斯修正我们可以分别修正为
这里写图片描述
这里写图片描述
拉普拉斯修正避免了因训练集样本不充分的而导致概率估计为0的问题,并且在训练集变大时,修正过程中所引入的先验的影响也会逐渐变得可忽略,使得估值逐渐趋向实际的概率值。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值