2014ICLR-Weighted Approximate Ranking (WARP)

最新推荐文章于 2021-02-04 17:52:40 发布

hinanmu

最新推荐文章于 2021-02-04 17:52:40 发布

阅读量569

点赞数

多标签学习同时被 2 个专栏收录

14 篇文章 4 订阅

订阅专栏

机器学习

12 篇文章 0 订阅

订阅专栏

文章目录

Deep Convolutional Ranking for Multilabel Image Annotation

2014 ICLR Google

多标签几种损失

成对排序损失

它直接对标注问题建模。特别是，我们希望将正面标签排在总是比负面标签更高的个刻度，这导致了以下最小化问题
$\sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { c _ { + } } \sum _ { k = 1 } ^ { c _ { - } } \max \left( 0,1 - f _ { j } \left( \boldsymbol { x } _ { i } \right) + f _ { k } \left( \boldsymbol { x } _ { i } \right) \right)$

其中c +是正标签，c-是负标签。在反向传播期间，我们计算了该损失函数的子梯度。
这种损失的一个限制是它优化了ROC曲线下面积（AUC），但没有直接优化top-k标注精度。
因为对于图像标注问题我们最感兴趣的是top-k标注，这种成对排名损失并不符合我们的目的。

加权近似排名（WARP）

这一损失是加权近似排名（WARP）是对上述损失函数的拓展，这在（2011 IJCAI-Wsabie: Scaling up to large vocabularyimage annotation）中首次描述。它通过使用随机抽样方法专门优化注释的top-k精度。这种方法非常适合深层体系结构的随机优化框架。它最小化
$\sum _ { i = 1 } ^ { n } \sum _ { j = 1 } ^ { c _ { + } } \sum _ { k = 1 } ^ { c _ { - } } L \left( r _ { j } \right) \max \left( 0,1 - f _ { j } \left( \boldsymbol { x } _ {i } \right) + f _ { k } \left( \boldsymbol { x } _ { i } \right) \right)$

其中 $L （ \cdot ）$ 是不同等级的加权函数， $r_j$ 是衡量某一个正标签预测值的惩罚程度。我们工作中使用的加权函数 $L （ \cdot ）$ 定义为：
$\sum _ { j = 1 } ^ { r } \dfrac {1}{j}$

如果正面标签在标签列表中排名靠前，那么 $L （ \cdot ）$ 将为损失分配一个小权重，并且不会花费太多损失。但是，如果正面标签没有排在最前面， $L （ \cdot ）$ 将为损失分配更大的权重，从而将正面标签推到顶部。
最后一个问题是如何估计等级 $r_j$ 。

求出 $r_j$ ，

对于每一个正标签 $j$ 的预测值 $f_j(x_i)$ ，从负标签预测值集合 $f_k, k \in c_-$ ，进行随机采样一个 $f_k$
一旦 $f_k$ 满足 $\left( x _ { i } \right) + f _ { k } \left( x _ { i } \right) > 0$ , 记录采样次数 $N$ ，则 $\left\lfloor \frac { C - 1 } { N } \right\rfloor$ , $c$ 为标签空间的维度
如果采样了 $C - 1$ 次都没有满足上式，则 $\left( r _ { j } \right)$ = 0，即不计算误差

hinanmu

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
4
评论
2014ICLR-Weighted Approximate Ranking (WARP)

文章目录Deep Convolutional Ranking for Multilabel Image Annotation2014 ICLR Google多标签几种损失成对排序损失加权近似排名（WARP）Deep Convolutional Ranking for Multilabel Image Annotation2014 ICLR Google多标签几种损失成对排序损失它直接对标...
复制链接

扫一扫