Huber和berHu损失函数

最新推荐文章于 2024-07-28 16:05:41 发布

又决定放弃

最新推荐文章于 2024-07-28 16:05:41 发布

阅读量2.8k

点赞数 3

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24884193/article/details/116356068

版权

深度学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

L1范数损失函数，也被称为最小绝对值偏差（LAD），最小绝对值误差（LAE）

在这里插入图片描述

L2范数损失函数，也被称为最小平方误差（LSE）
在这里插入图片描述

L2损失函数：不是非常的鲁棒；稳定解；；；总是一个解
L1损失函数：鲁棒；；；；；；不稳定解；；可能多个解

鲁棒性

最小绝对值偏差之所以是鲁棒的，是因为它能处理数据中的异常值。如果需要考虑任一或全部的异常值，那么最小绝对值偏差是更好的选择。

L2范数将误差平方化（如果误差大于1，则误差会放大很多），模型的误差会比L1范数来得大，因此模型会对这个样本更加敏感，这就需要调整模型来最小化误差。如果这个样本是一个异常值，模型就需要调整以适应单个的异常值，这会牺牲许多其它正常的样本，因为这些正常样本的误差比这单个的异常值的误差小。

稳定性

最小绝对值偏差方法的不稳定性意味着，对于数据集的一个小的水平方向的波动，回归线也许会跳跃很大。

相反地，最小平方法的解是稳定的，因为对于一个数据点的任何微小波动，回归线总是只会发生轻微移动

总结

MSE对误差取了平方，如果存在异常值，那么这个MSE就很大。

MAE更新的梯度始终相同，即使对于很小的值，梯度也很大，可以使用变化的学习率。MSE就好很多，使用固定的学习率也能有效收敛。
在这里插入图片描述

总而言之，处理异常点时，L1损失函数更稳定，但它的导数不连续，因此求解效率较低。L2损失函数对异常点更敏感，但通过令其导数为0，可以得到更稳定的封闭解。

Huber

l1和l2都存在的问题：

若数据中90%的样本对应的目标值为150，剩下10%在0到30之间。

那么使用MAE作为损失函数的模型可能会忽视10%的异常点，而对所有样本的预测值都为150，因为模型会按中位数来预测；

MSE的模型则会给出很多介于0到30的预测值，因为模型会向异常点偏移。

这些情况下最简单的办法是对目标变量进行变换。而另一种办法则是换一个损失函数，这就引出了下面要讲的第三种损失函数，即Huber损失函数。

Huber损失，平滑的平均绝对误差

Huber损失对数据中的异常点没有平方误差损失那么敏感。

本质上，Huber损失是绝对误差，只是在误差很小时，就变为平方误差。误差降到多小时变为二次误差由超参数δ（delta）来控制。当Huber损失在[0-δ,0+δ]之间时，等价为MSE，而在[-∞,δ]和[δ,+∞]时为MAE。
在这里插入图片描述

berHu损失

berHu恰恰和Huber相反，头很铁，当berHu损失在[0-δ,0+δ]之间时，等价为MAE，而在[-∞,δ]和[δ,+∞]时为MSE.

这样做的目的，就是给一个超严格的监督，让模型尽量达到最好效果。

参考：https://www.cnblogs.com/pacino12134/p/11104446.html

又决定放弃

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

又决定放弃 CSDN认证博客专家 CSDN认证企业博客

码龄10年

123: 原创

24万+: 周排名

17万+: 总排名

18万+: 访问

: 等级

2075: 积分

50: 粉丝

223: 获赞

62: 评论

738: 收藏

私信

关注

分类专栏

SLAM 5篇
算法 37篇
学术垃圾的自我救赎 19篇
深度学习 12篇
VSLAM 5篇
并行 1篇
pytorch 1篇
NLP 1篇
ROS 7篇
OpenCV 1篇
线代 2篇
分布式 1篇
Java 4篇
hadoop 1篇
ML 8篇
k8s 1篇
Go 1篇
nodejs 1篇
Tomcat 1篇
JSP 1篇
Servlet 1篇
maven 1篇
ssm 1篇
闲话 8篇

最新评论

GeoTransformer中的角度计算
无问吉凶，但思善恶: 博主，这个geotransformer的部署需要再乌班图上部署吗？
单目深度估计综述： Monocular Depth Estimation survey
又决定放弃: 谢谢指正。
单目深度估计综述： Monocular Depth Estimation survey
长风破浪也会有时: CityScapes数据集虽然没有直接提供深度，但是提供了视差图，和相机内参，可以通过视差图计算出深度
GeoTransformer的Coarse matching loss
又决定放弃: 可以看下https://github.com/qinzheng93/GeoTransformer/blob/main/experiments/geotransformer.3dmatch.stage4.gse.k3.max.oacl.stage2.sinkhorn/demo.py
GeoTransformer的Coarse matching loss
chaojiaicxy: 想问一下作者，如果我要跑我的点云的话，只有两个点云的值，也就是data_dict中只有['points'],但是代码中的需要train_dataset获取一个neighbor_limits的值，这个值是怎么获取的？因为我实际上没有train的数据，所以想请教一下

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。