每天五分钟机器学习:使用朴素贝叶斯算法的实际工程技巧有哪些?

本文介绍了在机器学习中应用朴素贝叶斯算法时的两个工程技巧。首先,通过取对数转换概率乘法为加法,减少计算复杂性,提高分类速度。其次,详细阐述了类别确定过程,通过比较不同类别的对数概率比来判断邮件类别。这些技巧将计算密集型任务移到训练阶段,提高了实时预测的效率。
摘要由CSDN通过智能技术生成

本文重点

经过前面几次课程的学习,我们已经学会了贝叶斯算法,本节课程我们学习一些应用贝叶斯算法的工程技巧,来看看一下如何能够让贝叶斯算法更快一些。

取对数

C垃圾=p(恭喜|垃圾邮件)p(您|垃圾邮件)p(的|垃圾邮件)p(条件|垃圾邮件)p(已|垃圾邮件)p(达标|邮件)p(特|垃圾邮件)p(通知|垃圾邮件)p(您|垃圾邮件)p(申请|垃圾邮件)p(金卡|垃圾邮件)p(资格|垃圾邮件)

C正常=p(恭喜|正常邮件)p(您|正常邮件)p(的|正常邮件)p(条件|正常邮件)p(已|正常邮件)p(达标|正常邮件)p(特|正常邮件)p(通知|正常邮件)p(您|正常邮件)p(申请|正常邮件)p(金卡|正常邮件)p(资格|正常邮件)

如果多的概率p相乘,效率一定不会快,那么我们可以取log,这样相乘就变为了相加

logC垃圾=logp(恭喜|垃圾邮件)+logp(您|垃圾邮件)+logp(的|垃圾邮件)+logp(条件|垃圾邮件)+logp(已|垃圾邮件)+logp(达标|邮件)+logp(特|垃圾邮件)+logp(通知|垃圾邮件)+logp(您|垃圾邮件)+logp(申请|垃圾邮件)+logp(金卡|垃圾邮件)+logp(资格|垃圾邮件)

然后关于log计算,可以在训练阶段直接计算 logP ,然后把他们存在一张大的hash表里。在判断的时候直接提取hash表中已经计算好的对数概率,然后相加

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

幻风_huanfeng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值