Top-k Hierarchical Classification
Despite that the fact that both top-k classification and hierarchical classification have gained increasing interests, the two problems have always been studied separately. In this paper, we define a top-k hierarchical loss function using a real world application. We provide the Bayes-optimal solution that minimizes the expected top-k hierarchical misclassification cost.
在top-k分类中,人们被允许做出k个预测,如果k个预测中至少有一个是正确的,就不会产生惩罚。
一、top-k 和 分层分类的区别
在top-k分类中,人们被允许做出k个预测,如果k个预测中至少有一个是正确的,就不会产生惩罚。由于ImageNet挑战赛的举办,Top-k分类问题获得了越来越多的关注。当类的数量很多,而且它们的区别很模糊时,允许多次猜测是一种自然的补救措施(Gupta, Bengio, and Weston 2014; Lapin, Hein, and Schiele 2015)。Precision@k也经常出现在其他应用领域,包括信息检索和搜索广告(Broder等人,2007;Usunier, Buffoni, and Gallinari,2009)。这类应用系统的用户往往只考虑用户界面上显示的前几个结果,因此,系统的性能取决于其顶部的预测精度。
分层分类,即类别形成一个结构化的层次,是分类问题的另一种常见形式。例如,在新闻文章分类中,"篮球"、"足球 "和 "棒球 "是 "体育 "类别的子类。在这种情况下,错误分类的成本取决于层次结构中正确类别和不正确类别之间的关系。例如,将 "篮球 "新闻归入 "足球 "类别的成本可能比将其归入 "国际政治 "类别的成本低。层次分类法将这种层次错误分类的成本考虑在内(Cesa-bianchi等人,2005)。分层分类问题的其他例子包括音乐、视频、图像识别(Deng等人,2012)、专利分类(Cai和Hofmann,2004;Eisinger等人,2013)、网络内容分类(Dumais和Chen,2000)和基因功能预测问题(Vens等人,2008)。这些文献提出了几个版本的分层损失函数,以及各种分类算法(Ram´ırez-Corona, Sucar, and Morales 2014; Bi and Kwok 2015; Ram´ırez-Corona, Sucar, and Morales 2016)。
二、文献调研
Hedging Your Bets: Optimizing Accuracy-Specificity Trade-offs in Large Scale Visual Recognition
对冲你的赌注。优化大规模视觉识别中的准确度-特异性权衡
启发:如果无法区分a和b的情况下,返回ab