深度学习常见损失函数

卍郝凝卍

于 2024-06-23 10:27:00 发布

阅读量265

点赞数 3

分类专栏：深度学习文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52057773/article/details/139896479

版权

深度学习专栏收录该内容

7 篇文章 0 订阅

订阅专栏

在深度学习中，大致分为回顾任务与分类任务，回归任务常用均方误差损失（MSE）和平均绝对误差损失（MAE）；分类任务常用交叉熵损失。

1. 均方误差损失（Mean Squared Error, MSE）

数学公式表达为：

特点：MSE 对于离群点（outliers）非常敏感，因为误差被平方了，所以大的误差会对整体的 MSE 产生更大的影响；MSE 是凸函数（convex function），在很多优化问题中，尤其是使用梯度下降法时，非常有用，因为凸函数的局部最小值就是全局最小值。

2. 平均绝对误差（Mean Absolute Error, MAE）

平均绝对误差（Mean Absolute Error, MAE）是一种衡量回归模型预测准确性的重要指标。它通过计算预测值与真实值之间的绝对误差的平均值来评估模型的性能。公式如下：

特点：MAE 对离群点（outliers）不如均方误差（MSE）敏感，因为它使用的是绝对值而不是平方值。因此，单个异常值不会对 MAE 产生过大的影响；MAE 的值与原始数据的单位相同，易于解释。例如，如果数据的单位是米，MAE 也是米，直接反映了平均预测误差；MAE 不是凸函数，这意味着在某些优化算法中（如梯度下降法）可能会带来挑战，因为局部最小值不一定是全局最小值。

3. 交叉熵损失（Cross-Entropy Loss）

又称对数损失（Log Loss），是一种常用于分类问题中的损失函数。它衡量的是两个概率分布之间的差异，特别是在神经网络和机器学习模型中广泛使用，用于评估模型输出的概率分布与实际标签分布的匹配程度。

在分类问题中，模型输出的是一个概率分布，表示每个类别的预测概率。对于二分类问题，可以使用 sigmoid 函数将输出值映射到 [0, 1] 区间；对于多分类问题，可以使用 softmax 函数将输出值映射到一个概率分布。

3.1 二分类问题中的交叉熵损失

3.2 多分类问题中的交叉熵损失

特点：交叉熵损失衡量的是两个概率分布之间的差异，反映了模型预测的概率分布与真实标签分布的匹配程度；由于交叉熵损失涉及对数运算，在计算时需注意数值稳定性，避免对数零或接近零的值。通常通过加一个小的常数（如 ϵ\epsilonϵ）来处理；交叉熵损失是凸函数（convex function），在优化过程中有助于找到全局最优解。

附：凹凸函数的定义：

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习常见损失函数

在深度学习中，大致分为回顾任务与分类任务，回归任务常用均方误差损失（MSE）和平均绝对误差损失（MAE）；分类任务常用交叉熵损失。数学公式表达为：特点：MSE 对于离群点（outliers）非常敏感，因为误差被平方了，所以大的误差会对整体的 MSE 产生更大的影响；MSE 是凸函数（convex function），在很多优化问题中，尤其是使用梯度下降法时，非常有用，因为凸函数的局部最小值就是全局最小值。平均绝对误差（Mean Absolute Error, MAE）是一种衡量回归模型预测准确性的重要指标。
复制链接

扫一扫

专栏目录

卍郝凝卍 CSDN认证博客专家 CSDN认证企业博客

码龄4年

21: 原创

114万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

417: 积分

176: 粉丝

207: 获赞

5: 评论

227: 收藏

私信

关注

热门文章

分类专栏

软件 1篇
深度学习 7篇
基础方法 1篇
目标检测 2篇
transformer 1篇
pytorch 3篇
数据结构 2篇
嵌入式 1篇
c++ 1篇

最新评论

深度学习之VIT
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Ubuntu远程部署docker问题记录
CSDN-Ada助手: 恭喜您写了第10篇博客！对于Ubuntu远程部署docker问题的记录，相信对很多读者都有很大的帮助。接下来，建议可以尝试分享一些解决问题的具体方法或者案例分析，这样可以更加深入地帮助读者理解和解决类似的困扰。期待您更多的创作！祝您写作顺利！
pytorch学习3
CSDN-Ada助手: 恭喜您发布了第9篇博客，标题为“pytorch学习3”！您的持续创作精神令人钦佩。建议您在接下来的创作中，可以尝试深入探讨pytorch的高级特性，或者结合实际案例进行更深入的分析，以便让读者更好地理解和应用所学知识。期待您更多精彩的文章！祝您创作顺利！
c++学习day2
CSDN-Ada助手: 太棒了，看到你坚持学习c++并分享学习笔记，真的很让人钦佩！三种结构中的顺序结构、选择结构、循环结构是c++中非常重要的基础知识，掌握好这些结构将为你今后的编程之路打下坚实的基础。除了这些基础知识外，我想提醒你在学习c++时，也要关注一些更高级的概念，比如面向对象编程、模板、异常处理等，这些知识将帮助你更深入地理解和运用c++语言。继续加油，期待看到你更多的学习成果！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
c++学习笔记 Day1
CSDN-Ada助手: 恭喜您开始了博客创作的第一步！学习C++是一项很不容易的任务，能够记录下学习笔记并分享给他人，是一种很好的学习方式。希望您能坚持下去，继续分享您的学习心得和经验。下一步建议可以尝试写一些实例代码，加深对C++语言的理解。加油！期待您的下一篇博客。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。