【机器学习】MSE和MAE损失函数有什么区别？回归问题的常用损失函数

XD742971636

于 2024-06-17 09:51:11 发布

阅读量1.1k

点赞数 14

分类专栏：深度学习机器学习文章标签：机器学习人工智能

# MIT

本文链接：https://blog.csdn.net/x1131230123/article/details/139735537

版权

深度学习机器学习专栏收录该内容

346 篇文章 40 订阅

订阅专栏

在机器学习和统计学中，均方误差（Mean Squared Error, MSE）和平均绝对误差（Mean Absolute Error, MAE）是两种常用的损失函数，用于评估模型预测值与真实值之间的差异。它们的区别主要体现在对误差的处理方式和对异常值的敏感性上。

均方误差 (MSE)

定义：
MSE 是预测值与真实值之间误差的平方的平均值。其公式如下：

$\text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2$

其中，( n ) 是样本数量，( y_i ) 是第 ( i ) 个样本的真实值，( \hat{y}_i ) 是第 ( i ) 个样本的预测值。

特点：

对大误差敏感：由于误差被平方处理，MSE 对大的误差比对小的误差更加敏感。这意味着如果存在异常值，MSE 会显著增大。
导数性质：MSE 的导数计算简单，易于应用于梯度下降等优化算法。

平均绝对误差 (MAE)

定义：
MAE 是预测值与真实值之间误差的绝对值的平均值。其公式如下：

$\text{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|$

特点：

对大误差不敏感：MAE 直接计算误差的绝对值，避免了平方操作，因此对异常值的敏感性较低。它能更均匀地对待所有误差。
鲁棒性：由于对异常值不敏感，MAE 更加鲁棒，适用于数据中存在离群点的情况。

区别总结

误差处理方式：
- MSE 使用平方处理误差，对大误差更加敏感。
- MAE 使用绝对值处理误差，对所有误差均一对待。
异常值影响：
- MSE 受到异常值的显著影响。
- MAE 对异常值的影响较小，更加鲁棒。
优化和求导：
- MSE 的平方性质使其导数在很多优化算法中计算更为简便。
- MAE 的绝对值使其在某些优化过程中可能不如 MSE 简单，但在一些鲁棒优化问题中更加有效。

选择何种损失函数

如果对异常值较为敏感，并且希望严重惩罚大的预测误差，可以选择 MSE。
如果数据中存在离群点，或者希望模型更加鲁棒，可以选择 MAE。

在实际应用中，有时会根据具体问题和数据分布的特点来选择合适的损失函数，甚至可以结合使用多种损失函数来平衡模型的表现。

在回归问题中，除了均方误差（MSE）和平均绝对误差（MAE），还有许多其他损失函数可供选择。这些损失函数各有其特点和适用场景。以下是一些常见的回归损失函数：

Huber 损失函数

定义：
Huber 损失结合了 MSE 和 MAE 的优点，当误差较小时表现为 MSE，当误差较大时表现为 MAE。其公式如下：

$L_{\delta}(a) = \begin{cases} \frac{1}{2}a^2 & \text{if } |a| \leq \delta \\ \delta (|a| - \frac{1}{2}\delta) & \text{otherwise} \end{cases}$

其中，(a = y_i - \hat{y}_i) 是误差，(\delta) 是一个超参数，控制转换点。

特点：

对小误差使用平方处理（与 MSE 类似），对大误差使用线性处理（与 MAE 类似）。
平滑过渡，结合了 MSE 和 MAE 的优点，既能对异常值有一定的鲁棒性，又能对小误差有良好的敏感性。

平方对数误差 (MSLE)

定义：
平方对数误差是预测值和真实值的对数之间差异的平方。其公式如下：

$\text{MSLE} = \frac{1}{n} \sum_{i=1}^n (\log(1 + y_i) - \log(1 + \hat{y}_i))^2$

特点：

对于较大的误差值，MSLE 会降低其影响。
更加关注相对误差，而非绝对误差，适用于目标值跨越多个数量级的情况。

指数损失函数 (Exponential Loss)

定义：
指数损失函数主要用于强化学习和分类任务，但也可以应用于回归任务中，其形式为：

$L(y_i, \hat{y}_i) = e^{|y_i - \hat{y}_i|} - 1$

特点：

对大误差进行指数惩罚，极其敏感于大误差。
适用于需要特别关注大误差的场景。

对称绝对百分比误差 (Symmetric Mean Absolute Percentage Error, SMAPE)

定义：
SMAPE 是基于百分比的误差度量，定义如下：

$\text{SMAPE} = \frac{100\%}{n} \sum_{i=1}^n \frac{|y_i - \hat{y}_i|}{(|y_i| + |\hat{y}_i|)/2}$

特点：

反映了预测值相对于真实值的百分比误差。
适用于需要比较不同比例误差的场景。

Quantile Loss（分位数损失）

定义：
Quantile Loss 用于预测目标变量的特定分位数，定义如下：

$L_{\tau}(y, \hat{y}) = \sum_{i=1}^n (\tau - 1_{y_i < \hat{y}_i})(y_i - \hat{y}_i)$

其中，(\tau) 是分位数（如 0.5 表示中位数）。

特点：

适用于需要预测目标变量的特定分位数的场景。
可以用来构建区间预测。

Pinball Loss（Pinball 损失）

定义：
Pinball Loss 是 Quantile Loss 的一种特殊形式，用于评估分位数预测，其公式如下：

$\hat{y}) = \sum_{i=1}^n \left\{ \begin{array}{ll} (1 - \tau)(\hat{y}_i - y_i), & \text{if } y_i \leq \hat{y}_i \\ \tau(y_i - \hat{y}_i), & \text{if } y_i > \hat{y}_i \end{array} \right.$

特点：

强调预测的分位数，不同于传统的平均误差度量。

选择适合的损失函数

选择合适的损失函数取决于具体的应用场景和数据特点：

如果对异常值特别敏感，可以考虑 MSE。
如果数据中存在离群点，MAE 或 Huber Loss 可能更合适。
如果需要对大误差进行严格控制，可以考虑 Exponential Loss。
如果需要考虑相对误差，可以使用 MSLE 或 SMAPE。
如果需要预测特定分位数，可以使用 Quantile Loss 或 Pinball Loss。

通过对不同损失函数的理解和实践，可以更好地选择适合特定回归问题的损失函数，提高模型的预测性能。

XD742971636

关注

14
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】MSE和MAE损失函数有什么区别？回归问题的常用损失函数

误差处理方式MSE 使用平方处理误差，对大误差更加敏感。MAE 使用绝对值处理误差，对所有误差均一对待。异常值影响MSE 受到异常值的显著影响。MAE 对异常值的影响较小，更加鲁棒。优化和求导MSE 的平方性质使其导数在很多优化算法中计算更为简便。MAE 的绝对值使其在某些优化过程中可能不如 MSE 简单，但在一些鲁棒优化问题中更加有效。
复制链接

扫一扫