神经网络算法 - 一文搞懂Loss Function（损失函数）

全栈海哥

已于 2024-03-15 18:38:46 修改

阅读量1k

点赞数 13

文章标签：神经网络算法人工智能

于 2024-03-15 18:38:39 首次发布

本文链接：https://blog.csdn.net/qq_39172059/article/details/136744078

版权

本文将从损失函数的本质、损失函数的原理、损失函数的算法三个方面，带您一文搞懂损失函数 Loss Function 。

损失函数

一、损失函数的本质

机器学习“三板斧”：选择模型家族，定义损失函数量化预测误差，通过优化算法找到最小化损失的最优模型参数。

机器学习 vs 人类学习

定义一个函数集合（模型选择）
- 目标：确定一个合适的假设空间或模型家族。
- 示例：线性回归、逻辑回归、神经网络、决策树等。
- 考虑因素：问题的复杂性、数据的性质、计算资源等。
判断函数的好坏（损失函数）
- 目标：量化模型预测与真实结果之间的差异。
- 示例：均方误差（MSE）用于回归；交叉熵损失用于分类。
- 考虑因素：损失的性质（凸性、可微性等）、易于优化、对异常值的鲁棒性等。
选择最好的函数（优化算法）
- 目标：在函数集合中找到最小化损失函数的模型参数。
- 主要方法：梯度下降及其变种（随机梯度下降、批量梯度下降、Adam等）。
- 考虑因素：收敛速度、计算效率、参数调整的复杂性等。

损失函数的本质：量化模型预测与真实结果之间的差异。

损失函数的本质

损失函数的位置

二、损失函数的原理

定义：误差是指模型在对单个数据点进行预测时，其预测结果与真实值之间的差异或偏离程度。这种差异反映了模型预测的不准确性或偏差。
计算：误差可以通过多种数学公式来计算。其中，绝对误差是预测值与真实值之间差值的绝对值，用于量化预测偏离真实值的实际大小；平方误差则是预测值与真实值之间差值的平方，常用于平方损失函数中，以便更显著地突出较大的误差。
误差棒：误差棒通常以线条或矩形的形式出现在数据点的上方、下方或两侧，其长度或大小代表了误差的量级。这种可视化方法有助于识别潜在的问题区域，并指导进一步的模型改进或数据分析。

误差棒

损失（Loss）：损失是衡量机器学习模型在整个数据集上预测不准确性的总体指标，通过最小化损失可以优化模型参数并改进预测性能。

定义：损失是衡量机器学习模型在整个数据集上预测的总体不准确性的指标。它反映了模型预测与真实值之间的差异，并将这些差异进行聚合，以提供一个标量值来表示预测的总体不准确性。
计算：损失的具体计算是通过损失函数来完成的。损失函数接受模型的预测值和真实值作为输入，并输出一个标量值，即损失值，表示模型在整个数据集上的总体预测误差。
损失曲线：损失曲线直观地呈现了模型在训练过程中损失值的变化趋势。通过绘制训练损失和验证损失随迭代次数的变化，我们能够洞察模型是否遭遇过拟合或欠拟合等问题，进而调整模型结构和训练策略。

损失曲线

三、损失函数的算法

损失函数的算法

均方差损失函数（MSE）：通过计算模型预测值与真实值之间差值的平方的平均值，衡量回归任务中预测结果的准确性，旨在使预测值尽可能接近真实值。

均方差损失函数（MSE）

均方差损失函数（MSE）公式

交叉熵损失函数（CE）：用于衡量分类任务中模型预测的概率分布与真实标签之间的差异，旨在通过最小化损失来使模型预测更加接近真实类别。

交叉熵损失函数（CE）

交叉熵损失函数（CE）公式

关注