机器学习中的损失函数（着重比较：hinge loss vs softmax loss）

最新推荐文章于 2025-03-26 20:12:48 发布

Vinicier

最新推荐文章于 2025-03-26 20:12:48 发布

阅读量8.6w

点赞数 40

分类专栏：机器学习深度学习文章标签：机器学习损失函数深度学习 SVM Softmax

本文链接：https://blog.csdn.net/u010976453/article/details/78488279

版权

本文详细介绍了机器学习中的损失函数，特别是对比了Hinge Loss和Softmax Loss。Hinge Loss主要用于支持向量机，旨在最大化分类间隔；而Softmax Loss，常用于多分类任务，提供归一化的概率输出，便于解释。理解这些损失函数有助于深入掌握SVM和Softmax分类器的工作原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 损失函数

损失函数（Loss function）是用来估量你模型的预测值 $f(x)$ 与真实值 $Y$ 的不一致程度，它是一个非负实值函数，通常用 $L(Y,f(x))$ 来表示。损失函数越小，模型的鲁棒性就越好。损失函数是经验风险函数的核心部分，也是结构风险函数的重要组成部分。模型的风险结构包括了风险项和正则项，通常如下所示：

θ * = arg min θ 1 N \sum i = 1 N L (y i, f (x i; θ)) + λ Φ (θ)

$\theta^* = \arg \min_\theta \frac{1}{N}{}\sum_{i=1}^{N} L(y_i, f(x_i; \theta)) + \lambda\ \Phi(\theta)$
其中，前面的均值函数表示的是经验风险函数，

L $L$ 代表的是损失函数，后面的

Φ $\Phi$ 是正则化项（regularizer）或者叫惩罚项（penalty term），它可以是L1，也可以是L2，或者其他的正则函数。整个式子表示的意思是 找到使目标函数最小时的 $\theta$ 值。

2. 常用损失函数

常见的损失误差有五种：
1. 铰链损失（Hinge Loss）：主要用于支持向量机（SVM）中；
2. 互熵损失（Cross Entropy Loss，Softmax Loss ）：用于Logistic 回归与Softmax 分类中；
3. 平方损失（Square Loss）：主要是最小二乘法（OLS）中；
4. 指数损失（Exponential Loss） ：主要用于Adaboost 集成学习算法中；
5. 其他损失（如0-1损失，绝对值损失）