深度学习面试总结-4 损失函数

weixin_44351910

已于 2022-09-20 16:59:11 修改

阅读量256

点赞数

分类专栏：深度学习面试总结文章标签：深度学习人工智能

于 2022-09-15 20:57:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44351910/article/details/126846751

版权

深度学习面试总结专栏收录该内容

5 篇文章 0 订阅

订阅专栏

损失函数：在深度学习中，损失函数是用来衡量模型参数的质量的函数，比较网络输出和真实输出的差异。

1.分类任务的损失函数

分类任务中使用最多的是交叉熵损失函数

1.1多分类任务

在多分类任务重通常使用softmax将logits转换为概率的形式，所以多分类的交叉熵损失也叫做softmax损失，它的计算方式是：

其中，y是样本x属于某一个类别的真实概率，f(x)是样本属于某一个类别的预测分数，S是softmax函数，L用来衡量p,q之间差异性的损失结果。

2.回归任务的损失函数

2.1均方误差(MSE,L2损失)

在这里插入图片描述

均方差Mean Squared Reeoe(MSE)损失是机器学习、深度学习回归任务中最常用的一种损失函数，也称为 L2 Loss。

优点：

计算方便，逻辑清晰，衡量误差较准确
梯度随着误差增大或减小，收敛效果好

缺点：

对异常点会赋予较大的权重，如果异常点不属于考虑范围，是由于某种错误导致的，则此函数指导方向将出现偏差

2.2 .平均绝对值误差(MAE,L1损失)

在这里插入图片描述

优点：

对异常值具有较好鲁棒性

缺点：

梯度不变是个严重问题，即使对于很小的损失，梯度也很大，不利于模型收敛，常使用变化的学习率解决

2.3 Huber损失，平滑的平均绝对误差

在这里插入图片描述

MSE和MAE损失各自有有优缺点，MSE损失收敛快但容易受异常的影响，MAE对异常点更加稳定但收敛慢。huber loss 则是一种将 MSE 与 MAE 结合起来，取两者优点的损失函数，也被称作 Smooth Mean Absolute Error Loss 。其原理很简单，就是在误差接近 0 时使用 MSE，误差较大时使用 MAE。

Huber Loss 的特点
Huber Loss 结合了 MSE 和 MAE 损失，在误差接近 0 时使用 MSE，使损失函数可导并且梯度更加稳定；在误差较大时使用 MAE 可以降低 outlier 的影响，使训练对 outlier 更加健壮。缺点是需要额外地设置一个 δ 超参数。

参考

(57条消息) 回归问题中5种常用损失函数_sjokes的博客-CSDN博客_回归问题损失函数

机器学习（十）：损失函数 - 知乎 (zhihu.com)

weixin_44351910

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。