拉普拉斯平滑（Laplacian smoothing）

最新推荐文章于 2025-03-02 16:38:25 发布

潜心学习的渣渣

最新推荐文章于 2025-03-02 16:38:25 发布

阅读量2.5w

点赞数 37

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43868020/article/details/106602799

版权

机器学习专栏收录该内容

7 篇文章

订阅专栏

概念

零概率问题：在计算事件的概率时，如果某个事件在观察样本库（训练集）中没有出现过，会导致该事件的概率结果是0。这是不合理的，不能因为一个事件没有观察到，就被认为该事件一定不可能发生（即该事件的概率为0）。

拉普拉斯平滑(Laplacian smoothing) 是为了解决零概率的问题。

法国数学家 拉普拉斯 最早提出用加1 的方法，估计没有出现过的现象的概率。
理论假设：假定训练样本很大时，每个分量x的计数加1造成的估计概率变化可以忽略不计，但可以方便有效的避免零概率问题

具体公式

总结：分子加一，分母加K，K代表类别数目。

应用场景举例

假设在文本分类中，有3个类：C1、C2、C3。
在指定的训练样本中，某个词语K1，在各个类中观测计数分别为0，990，10。
则对应K1的概率为0，0.99，0.01。

显然C1类中概率为0，不符合实际。

于是对这三个量使用拉普拉斯平滑的计算方法如下：
　　1/1003 = 0.001，991/1003=0.988，11/1003=0.011
　　
在实际的使用中也经常使用加 λ（0≤λ≤1）来代替简单加1。如果对N个计数都加上λ，这时分母也要记得加上N*λ

参考文献

https://blog.csdn.net/qq_25073545/article/details/78621019

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。