深度学习之常见损失函数简介：名称、作用及用法

SEVEN-YEARS

于 2024-09-18 21:45:07 发布

阅读量584

点赞数 14

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73697499/article/details/142344389

版权

引言

在机器学习和深度学习中，损失函数（Loss Function）是模型训练过程中一个不可或缺的部分。它用来度量模型预测结果与真实值之间的差异，从而指导模型参数的优化。合理选择损失函数对于提高模型的准确性和泛化能力至关重要。本文将介绍几种常用的损失函数，并探讨它们的用途和应用场景。

1. L1 Loss（L1 损失）

名称: L1 Loss 或 Mean Absolute Error (MAE)

作用: 用于回归问题，衡量预测值与真实值之间的绝对差异。

公式:

用法: 适用于需要预测连续值的任务，如天气预报、房价预测等。

特点: 对较大的误差不那么敏感，更适合数据中有较多离群点的情况。

2. NLL Loss (Negative Log Likelihood Loss)

名称: NLL Loss 或 Negative Log Likelihood Loss

作用: 用于分类问题，特别是多分类问题，衡量预测概率分布与真实标签之间的差异。

公式:

用法: 适用于多分类任务，如图像分类、文本分类等。

特点: 当预测概率接近真实标签时，损失值较小，反之则较大。

3. NLLLoss2d

名称: NLLLoss2d

作用: 用于二维空间上的分类问题，如图像分割等。

公式: 与 NLL Loss 类似，但是针对二维数据进行设计。

用法: 适用于图像分割等需要在二维空间上进行分类的问题。

特点: 通常用于卷积神经网络中，处理图像等二维数据。

4. Gaussian NLL Loss

名称: Gaussian NLL Loss

作用: 用于回归问题，特别是在具有高斯噪声的场景中。

公式:

其中 CC 是一个常数项。

用法: 适用于回归任务，特别是当数据有高斯噪声时。

特点: 考虑了预测的不确定度，适用于需要估计预测不确定性的场景。

5. MSE Loss (Mean Squared Error Loss)

名称: MSE Loss 或 Mean Squared Error Loss

作用: 用于回归问题，衡量预测值与真实值之间的平方差异。

公式:

用法: 适用于需要预测连续值的任务，如天气预报、股价预测等。

特点: 对较大的误差更敏感，容易受到离群点的影响。

6. BCE Loss (Binary Cross-Entropy Loss)

名称: BCE Loss 或 Binary Cross-Entropy Loss

作用: 用于二分类问题，衡量预测概率与真实标签之间的差异。

公式:

用法: 适用于二分类任务，如垃圾邮件过滤、疾病诊断等。

特点: 特别适用于二分类问题，当输出层使用 Sigmoid 函数时尤为适用。

7. Smooth L1 Loss

名称: Smooth L1 Loss

作用: 结合了 L1 和 MSE 损失的优点，用于回归问题。

公式:

用法: 适用于回归任务，特别是需要平衡异常值影响的情况。

特点: 在误差较小时表现出 MSE 的性质，在误差较大时表现出 L1 的性质。

8. Cross Entropy Loss

名称: Cross Entropy Loss

作用: 用于分类问题，特别是多分类问题，衡量预测概率分布与真实标签之间的差异。

公式:

用法: 适用于多分类任务，如图像分类、情感分析等。

特点: 当预测概率接近真实标签时，损失值较小，反之则较大。

结论

这些损失函数各有其适用场景，选择合适的损失函数对于模型的性能至关重要。了解不同损失函数的特点及其应用场景可以帮助我们在实践中做出更好的选择。

关注

14
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。