平滑

拉普拉斯平滑
背景:为什么要做平滑处理?

.
   解决 零概率问题,若某个量x,训练集中未出现,会导致整个实例概率结果是0。但不合理。
  应用:文本分类中,某词语未在训练集中出现,该词语概率为0,连乘计算文本概率为0,不合理。不能因为没有观察到就认为该事件的概率是0。

拉普拉斯=加法平滑,解决零概率问题。(分子+1) / (分母+1)

应用举例

假设在文本分类中,有3个类,C1、C2、C3。词语K1,各个类中观测计数分别为0,990,10。
  未平滑前:K1的概率为0,0.99,0.01,
  拉普拉斯平滑后:1/1003 = 0.001,991/1003=0.988,11/1003=0.011

在实际的使用中也经常使用加 lambda(1≥lambda≥0)来代替简单加1。如果对N个计数都加上lambda,这时分母也要记得加上N*lambda。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值