机器学习中的 L1,L2 loss分别是什么

最新推荐文章于 2024-07-06 17:06:00 发布

大西瓜不甜

最新推荐文章于 2024-07-06 17:06:00 发布

阅读量4.6k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mid_Faker/article/details/105650523

版权

本文介绍了机器学习中的L1和L2损失函数，包括它们的定义、优缺点以及在处理异常值时的鲁棒性。L1损失（MAE）对异常值更鲁棒，但导数在中心点有断点；L2损失（MSE）连续可导，但对异常值敏感，可能导致梯度爆炸问题。Smooth L1损失函数则是为了结合两者优点，提高训练稳定性。

摘要由CSDN通过智能技术生成

一、常见的MSE、MAE损失函数
1.1 均方误差、平方损失
均方误差（MSE）是回归损失函数中最常用的误差，它是预测值与目标值之间差值的平方和，其公式如下所示：

在这里插入图片描述

下图是均方根误差值的曲线分布，其中最小值为预测值为目标值的位置。

在这里插入图片描述
优点：各点都连续光滑，方便求导，具有较为稳定的解

缺点：不是特别的稳健，为什么？因为当函数的输入值距离中心值较远的时候，使用梯度下降法求解的时候梯度很大，可能导致梯度爆炸。

什么是梯度爆炸？
误差梯度是神经网络训练过程中计算的方向和数量，用于以正确的方向和合适的量更新网络权重。
在深层网络或循环神经网络中，误差梯度可在更新中累积，变成非常大的梯度，然后导致网络权重的大幅更新，并因此使网络变得不稳定。在极端情况下，权重的值变得非常大，以至于溢出，导致 NaN 值。
网络层之间的梯度（值大于 1.0）重复相乘导致的指数级增长会产生梯度爆炸。

梯度爆炸引发的问题
在深度多层感知机网络中，梯度爆炸会引起网络不稳定，最好的结果是无法从训练数据中学习，而最坏的结果是出现无法再更新的 NaN 权重值。

1.2 平均绝对误差
平均绝对误差

最低0.47元/天解锁文章

大西瓜不甜

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
机器学习中的 L1,L2 loss分别是什么

一、常见的MSE、MAE损失函数1.1 均方误差、平方损失均方误差（MSE）是回归损失函数中最常用的误差，它是预测值与目标值之间差值的平方和，其公式如下所示：下图是均方根误差值的曲线分布，其中最小值为预测值为目标值的位置。优点：各点都连续光滑，方便求导，具有较为稳定的解缺点：不是特别的稳健，为什么？因为当函数的输入值距离中心值较远的时候，使用梯度下降法求解的时候梯度很大，可能...
复制链接

扫一扫

专栏目录

大西瓜不甜 CSDN认证博客专家 CSDN认证企业博客

码龄8年

374: 原创

3万+: 周排名

185万+: 总排名

104万+: 访问

: 等级

1万+: 积分

186: 粉丝

773: 获赞

122: 评论

3397: 收藏

私信

关注

分类专栏

资料 33篇
网页编程 8篇
windows 12篇
算法 20篇
linux 18篇
网络 5篇
windows黑客技术 3篇
硬件 15篇
java 50篇
diary 3篇
嵌入式 14篇
深度学习 34篇
project 14篇
数据库 10篇
机试 19篇
lajicode 5篇
python 97篇
c++ 72篇
android 13篇

最新评论

dev c++ 打开项目管理窗口
2401_86772742: 这个窗口用英文叫什么
【计算机组成原理】神奇的补码
做而论道_CS: 在计算机系统中，数值，一律采用补码表示和存储。在计算机系统中，原码和反码，都是不存在的。既然，原码反码都不存在！　你拿什么取反？　　你又拿什么加一？况且，原码反码补码的范围，也是不同的。例如，码长八位，各码范围如下。　原码：－127 ~ +127；　反码：－127 ~ +127；　补码：－128 ~ +127。－128，只有补码。　没有原码反码，取反加一，怎么操作？　　－128 的补码，怎么求出来的？不要迷信取反加一，那只不过是一个“简便方法”而已。原码取反加一，并没有理论基础。－－－－－－－－－－－－－－－－－－－计算机使用的，是：二进制数。进行数字运算时，二进制数，也是数！不要以为二进制，就是什么什么码！所谓的 “原码反码补码”，都是计算机专家【忽悠】出来的。所谓的 “原码反码补码”，都是根本就不存在的事。所谓的 “补码”，也是正常的数字，而且是正数。你看十进制，两位数，就是：0 ~ 99。可以有：27 + 99 = (一百) 26 也可以：27 － 1 = 26 如果你忽略进位，仍旧保持两位数，　这两种算法的功能，就是相同的。就是说，当你舍弃了进位：　正数(如 +99)，就能当做负数(－1)使用。　加法，也就能完成减法运算！如果在计算机中，舍弃进位：　减法器，就可以不用了。　有一个加法器，就能横行天下！【舍弃进位】，这就是 “补码” 的根源。所谓的 “补码”，与 “原码反码取反加一”，没有半点关系。
在Windows中安装Hadoop（非虚拟机安装）
T19X19BTR: 这个教程看的够费劲的奥
android studio 开发报错keep stopping 原因整合
2201_75994726: Clearcut transport failed to make network request怎么办呀？
堆栈详解
2301_81250318: 我是小白，看的途中我心跳加快，呼吸急促，

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。