多类 SVM 的损失函数及其梯度计算

最新推荐文章于 2022-11-13 12:14:27 发布

五道口纳什

最新推荐文章于 2022-11-13 12:14:27 发布

阅读量5k

点赞数 3

分类专栏：机器学习实战

本文链接：https://blog.csdn.net/lanchunhui/article/details/70991228

版权

机器学习实战专栏收录该内容

31 篇文章 3 订阅

订阅专栏

CS231n Convolutional Neural Networks for Visual Recognition —— optimization

1. 多类 SVM 的损失函数（Multiclass SVM loss）

在给出类别预测前的输出结果是实数值，也即根据 score function 得到的 score（ $s=f(x_i, W)$ ），

L i = \sum j \neq y i max (0, s j - s y i + Δ), Δ = 1 （ 一 般 情 况 下 ）

$L_i=\sum_{j\neq y_i}\max(0, s_j-s_{y_i}+\Delta), \quad \Delta=1（一般情况下）$

$y_i$ 表示真实的类别， $s_{y_i}$ 在真实类别上的得分；
$s_j, j\neq y_i$ 在其他非真实类别上的得分，也即预测错误时的得分；

则在全体训练样本上的平均损失为：

L = 1 N \sum i = 1 N L i

$L = \frac1N\sum_{i=1}^NL_i$

delta = 1
scores = np.dot(W, X)
correct_scores = scores[y, np.arange(num_samples)]

diff = score - correct_scores + delta
diff[y, np.arange(num_samples)] = 0

thresh = np.maximum(0, diff)
loss = np.sum(thresh)
loss /= num_samples

2. 优化（optimization）：梯度计算

首先来看损失函数的定义，如下为第 $i$ 个样本的损失值（ $W_{c\times d}\cdot X_{d\times N}$ ， $d$ 特征向量的维度， $c$ ：输出类别的个数）：

L i = = \sum j \neq y i max (0, s j - s y i + 1) \sum j \neq y i [max (0, w T j x i - w T y i x i + 1)]

$\begin{split} L_i =&\sum_{j\neq y_i}\max(0, s_j-s_{y_i}+1)\\ =&\sum_{j\neq y_i} \left[ \max(0, w_j^Tx_i - w_{y_i}^Tx_i + 1) \right] \end{split}$

遍历 $j$ ，就是遍历 $W$ 每一列的每一个元素， $w_j^Tx_i ⇒ j=1,\ldots,c; i=1,\ldots,N$
$w_j^T$ 表示 $W$ 的每一行，共 $c$ 行；

下面的额关键是如何求得损失函数关于参数 $w{j, w_{y_i}}$ 的梯度：

\nabla w y i L i = - ⎛ ⎝ \sum j \neq y i 1 (w T j x i - w T y i x i + Δ > 0) ⎞ ⎠ x i \nabla w j L i = 1 (w T j x i - w T y i x i + Δ > 0) x i j \neq y i

$\begin{split} &\nabla_{w_{y_i}} L_i = - \left( \sum_{j\neq y_i} \mathbb{1}(w_j^Tx_i - w_{y_i}^Tx_i + \Delta > 0) \right) x_i\\ &\nabla_{w_j} L_i = \mathbb{1}(w_j^Tx_i - w_{y_i}^Tx_i + \Delta > 0) x_i\quad j\neq y_i \end{split}$

binary = thresh 
binary[thresh > 0] = 1          # 实现 indicator 函数

col_sum = np.sum(binary, axis=0)
binary[y, np.arange(num_samples)] = -col_sum

dW = np.dot(binary, X.T)        # binary 维度信息：c*N, X 维度信息：d*N
dW /= N

dW += reg * W

五道口纳什

关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
0
评论
多类 SVM 的损失函数及其梯度计算

CS231n Convolutional Neural Networks for Visual Recognition —— optimization1. 多类 SVM 的损失函数（Multiclass SVM loss）
复制链接

扫一扫