每天五分钟机器学习算法:朴素贝叶斯算法中如何应用平滑技术?

为什么要有平滑技术

P((“我”,“司”,“可”,“办理”,“正规发票”)|S)=

P(“我”|S)P(“司”|S)P(“可”|S)P(“办理”|S)P(“正规发票”|S

假如在训练集中我们发现正规发票从来没有出现过,那么P(“正规发票”|S)=0,那么整个概率相乘就变成了0,那么为了解决这个问题,我们使用平滑技术。

拉普拉斯平滑(平滑技术)

针对于不同的模型,拉普拉斯平滑有不同的方法

 

伯努利模型

 

多项式模型的拉普拉斯的举例:

每封垃圾邮件中所有词出现次数(计算重复次数)的总和+被统计的词表的词语数量

被统计的词表的词语数量是这样计算的:

原始训练集中每封邮件词的个数(不重复)+测试集中词的个数(预测邮件)

总之就是训练集和测试集的所有词(去重)

举例来说:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

幻风_huanfeng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值