smooth L1损失函数

最新推荐文章于 2023-12-28 16:15:31 发布

apbckk1506

最新推荐文章于 2023-12-28 16:15:31 发布

阅读量289

点赞数

原文链接：http://www.cnblogs.com/pacino12134/p/11407897.html

版权

当预测值与目标值相差很大时，L2 Loss的梯度为(x-t)，容易产生梯度爆炸，L1 Loss的梯度为常数，通过使用Smooth L1 Loss，在预测值与目标值相差较大时，由L2 Loss转为L1 Loss可以防止梯度爆炸。

L2 loss的导数（梯度）中包含预测值与目标值的差值，当预测值和目标值相差很大，L2就会梯度爆炸。说明L2对异常点更敏感。L1 对噪声更加鲁棒。

当差值太大时, loss在|x|>1的部分采用了 l1 loss，避免梯度爆炸。原先L2梯度里的x−t被替换成了±1, 这样就避免了梯度爆炸, 也就是它更加健壮。

总的来说：相比于L2损失函数，其对离群点、异常值（outlier）不敏感，可控制梯度的量级使训练时不容易跑飞。

转载于:https://www.cnblogs.com/pacino12134/p/11407897.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
smooth L1损失函数

当预测值与目标值相差很大时，L2Loss的梯度为(x-t)，容易产生梯度爆炸，L1Loss的梯度为常数，通过使用SmoothL1Loss，在预测值与目标值相差较大时，由L2Loss转为L1Loss可以防止梯度爆炸。L2 loss的导数（梯度）中包含预测值与目标值的差值，当预测值和目标值相差很大，L2就会梯度爆炸。说明L2对异常点更敏感。L1 对噪声更加鲁棒。...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。