机器学习基础（四十二）—— 常用损失函数的设计（multiclass SVM loss & hinge loss）

最新推荐文章于 2024-07-28 10:05:52 发布

五道口纳什

最新推荐文章于 2024-07-28 10:05:52 发布

阅读量9.3k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/lanchunhui/article/details/51073745

版权

121 篇文章 39 订阅

订阅专栏

损失函数，又叫代价函数（成本函数，cost function），是应用优化算法解决问题的关键。

误分类的概率为：

P (Y \neq f (X)) = 1 - P (Y = f (X))

$P(Y\neq f(X))=1-P(Y=f(X))$

我们不妨记 $m\triangleq f_\theta(x)\cdot y$ （其中 $y\in \{-1, 1\}$ 。对于二分类问题，最理想的损失函数是 0/1 损失函数，

0/1 损失函数既不是处处可微（乘积，也即 $m=0$ 处，），又不是凸函数，所以直接最小化 0/1 损失函数很困难。这就需要用到 hinge 损失函数了

在给出类别预测前的输出结果是实数值，也即根据 score function 得到的 score（ $s=f(x_i, W)$ ），

L i = \sum j \neq y i max (0, s j - s y i + 1)

$L_i=\sum_{j\neq y_i}\max(0, s_j-s_{y_i}+1)$

则在全体训练样本上的平均损失为：

L = 1 N \sum i = 1 N L i

$L = \frac1N\sum_{i=1}^NL_i$

scores = np.dot(W, X)
correct_scores = scores[y, np.arange(num_samples)]

loss = score - correct_scores + 1
loss[y, np.arange(num_samples)] = 0

仍然作如下记号， $m\triangleq f_\theta(x)\cdot y$ ，hinge 函数的形式为：

J hinge = min {0, 1 - m}

$J_{\text{hinge}}=\min\{0, 1-m\}$

二者的几何图形为：

Hinge 损失的名字是源自它跟打开 135° 的折叶（hinge）长得很像。

关注

专栏目录