机器学习的分类问题和回归问题的损失函数

最新推荐文章于 2024-06-17 09:51:11 发布

bwqiang

最新推荐文章于 2024-06-17 09:51:11 发布

阅读量1.4k

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bwqiang/article/details/107551438

版权

本文深入探讨了机器学习中的损失函数，包括回归问题的均方误差（MSE）、绝对值损失（MAE）和Huber损失，以及分类问题的0-1损失、交叉熵损失、Logistic损失、铰链损失和指数损失。通过对这些损失函数的数学表达式和特性的分析，揭示了它们在不同场景下的适用性和优缺点。

摘要由CSDN通过智能技术生成

前几天面试了一个互联网小公司的算法岗，结果面试官避开了所有的应用项目问题的考察转向对理论知识的考察，但我回答的不是很理想，所以承接着上一个博客和这个博客有可能还有下一个博客，好好的将机器学习中的基本理论知识透彻地总结一下。

损失函数一般的写法是 $L (y, f (x))$ ，是指通过机器学习模型预测出来的样本的标签和样本真实的标签的某个不一致的度量。损失函数一般是越小越好。

在回归问题中，损失函数表示为： $y - f (x)$ ；在分类问题中，表示为： $y f (x)$ 。

回归问题中的损失函数表示

回归问题的学习等价于函数拟合：选择一条函数曲线使其很好的拟合已知数据并很好地预测未知数据。所以回归问题中的 $y$ 和 $f (x)$ 均 $\in{\mathbb{R}}$ 且用残差 $y - f (x)$ 来度量回归问题的预测值和真实值的不一致程度。

1、均方误差损失（MSE，L2 loss）

均方误差损失又叫做 $L 2$ 损失，数学表达式如下：

$L(y,\hat{y})=\frac{1}{n}\sum_{i=1}^n(y_i-f(x_i))^2.$

这是最常见的损失函数，是凸函数，可以使用梯度下降法进行优化。但对于远离真实值的点相对来说比较敏感，损失函数的代价值很大，这造成了均方误差损失函数的鲁棒性变差。

2、绝对值损失（MAE，L1 Loss）

绝对值损失函数又叫做 $L 1$ 损失函数，数学表达式如下：

$L(y,\hat{y})=\frac{1}{n}\sum_{i=1}^n|y_i-f(x_i)|.$

绝对值损失函数对偏远点的处理相对均方误差来说很好，但是在 $y = f (x)$ 处是不可导函数，并且 $M A E$ 更新的梯度始终相同，在接近最优值处仍可能维持着较大的梯度而错过最优值。

3、 Huber损失函数

函数公式如下：

$L ( y , y ^ ) = { 1 2 ∣ y − f ( x ) ∣ 2 , if ∣ y − f ( x ) ∣ ≤ δ δ ∣ y − f ( x ) ∣ − 1 2 δ 2 , if ∣ y − f ( x$

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习的分类问题和回归问题的损失函数

前几天面试了一个互联网小公司的算法岗，结果面试官避开了所有的应用项目问题的考察转向对我理论只是的考察，但回答的不是很理想，所以承接着上一个博客和这个博客有可能还有下一个博客，好好的将机器学习中的基本理论知识透彻地总结一下。损失函数一般的写法是L(y,f(x))L(y,f(x))L(y,f(x))，是指通过机器学习模型预测出来的样本的标签和样本真实的标签的某个不一致的度量。损失函数一般是越小越好。在回归问题中，损失函数表示为：y−f(x)y-f(x)y−f(x)；在分类问题中，表示为：yf(x
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。