损失函数总结

秦乐乐

于 2023-06-25 13:42:01 发布

阅读量1k

点赞数

文章标签：算法 python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qinlele1994/article/details/131375549

版权

MSE（L2损失）

均方误差（MSE）是回归损失函数中最常用的误差，它是预测值与目标值之间差值的平方和，其公式如下所示：

在这里插入图片描述

下图是均方根误差值的曲线分布，其中最小值为预测值为目标值的位置

在这里插入图片描述

优点：各点都连续光滑，方便求导，具有较为稳定的解

缺点：不是特别的稳健，为什么？因为当函数的输入值距离中心值较远的时候，使用梯度下降法求解的时候梯度很大，可能导致梯度爆炸。

什么是梯度爆炸？
误差梯度是神经网络训练过程中计算的方向和数量，用于以正确的方向和合适的量更新网络权重。
在深层网络或循环神经网络中，误差梯度可在更新中累积，变成非常大的梯度，然后导致网络权重的大幅更新，并因此使网络变得不稳定。在极端情况下，权重的值变得非常大，以至于溢出，导致 NaN 值。
网络层之间的梯度（值大于 1.0）重复相乘导致的指数级增长会产生梯度爆炸。

梯度爆炸引发的问题
在深度多层感知机网络中，梯度爆炸会引起网络不稳定，最好的结果是无法从训练数据中学习，而最坏的结果是出现无法再更新的 NaN 权重值

MAE（L1损失）

平均绝对误差（MAE）是另一种常用的回归损失函数，它是目标值与预测值之差绝对值的和，表示了预测值的平均误差幅度，而不需要考虑误差的方向，范围是0到∞，其公式如下所示

在这里插入图片描述

在这里插入图片描述

优点：无论对于什么样的输入值，都有着稳定的梯度，不会导致梯度爆炸问题，具有较为稳健性的解。
缺点：在中心点是折点，不能求导，不方便求解。

上面的两种损失函数也被称之为L2损失和L1损失。

L1_Loss

L1范数损失函数，也被称为最小绝对值偏差（LAD），最小绝对值误差（LAE）。总的说来，它是把目标值（Yi)与估计值（f(xi))的绝对差值的总和（S)最小化

在这里插入图片描述

L2_Loss

L2范数损失函数，也被称为最小平方误差（LSE）。总的来说，它是把目标值（Yi)与估计值（f(xi))的差值的平方和（S)最小化：
在这里插入图片描述

smooth L1损失函数

smooth L1说的是光滑之后的L1，前面说过了L1损失的缺点就是有折点，不光滑，导致不稳定，那如何让其变得光滑呢？smooth L1损失函数为：

在这里插入图片描述

smooth L1损失函数曲线如下图所示，作者这样设置的目的是想让loss对于离群点更加鲁棒，相比于L2损失函数，其对离群点（指的是距离中心较远的点）、异常值（outlier）不敏感，可控制梯度的量级使训练时不容易跑飞

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
损失函数总结

smooth L1损失函数曲线如下图所示，作者这样设置的目的是想让loss对于离群点更加鲁棒，相比于L2损失函数，其对离群点（指的是距离中心较远的点）、异常值（outlier）不敏感，可控制梯度的量级使训练时不容易跑飞。平均绝对误差（MAE）是另一种常用的回归损失函数，它是目标值与预测值之差绝对值的和，表示了预测值的平均误差幅度，而不需要考虑误差的方向，范围是0到∞，其公式如下所示。smooth L1说的是光滑之后的L1，前面说过了L1损失的缺点就是有折点，不光滑，导致不稳定，那如何让其变得光滑呢？
复制链接

扫一扫

秦乐乐 CSDN认证博客专家 CSDN认证企业博客

码龄6年

87: 原创

4万+: 周排名

211万+: 总排名

20万+: 访问

: 等级

2866: 积分

300: 粉丝

122: 获赞

218: 评论

1014: 收藏

私信

关注

分类专栏

最新评论

【仓库物资识别】四、将三维点云转换成二维图像（修正后）
a1518322628: 你好，请问一下，点云转换为二维图像后，二维图像的长宽是怎么获得的？
【点云处理】改进半径滤波实现对激光雷达点云的去噪
hxznbahhh: 博主你好，请问可以分享代码吗？感谢
【点云处理】K-means聚类算法在点云数据精简上的应用
SYRE erys: 请问报错“Debug Assertion Failed! Program: c:\windows\SYSTEM32\MSVCP140D.dllFile: c:\program files (x86)\microsoft visual studio14.0\vc\include\vectorLine: 1234 Expression: vector subscript out of range For information on how your program can cause an assertionfailure, see the Visual C++ documentation on asserts. (Press Retry to debug the application)” 是怎么回事呢？
【点云处理】PCL点云库使用报错汇总
m0_59768177: 你好博主我出现了问题一的报错用你的方法找命令提示符显示找不到debug.lib 结尾的文件，找不到release.lib 结尾的文件。路径如下D:\PCL\PCL 1.12.0\3rdParty\VTK\lib我装了两个pcl这个目录下也没有 D:\PCL\PCL 1.12.1\3rdParty\VTK\lib
【点云处理】Kinect+PCL 获取原始点云
卢卡不吃柠檬: 老哥我也是kinect for xbox 360 你找到怎么得到点云图的代码了吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。