《Leveraging Implicit Relative Labeling-Importance Information for Effective Multi-Label Learning》
文章发表在2015年ICDM上 作者是东南大学PALM实验室的 李宇琨学长 张敏灵教授 以及 耿新教授
实验室主页 http://palm.seu.edu.cn/
一.前言
在机器学习中,传统监督学习是研究得最多、应用最广泛的一种学习框架。在该框架下,对于真实世界的每一个对象,学习系统在输入空间用一个示例(instance,通常为属性向量)刻画对象的性质,同时在输出空间将示例与反映该对象语义信息的类别标记(label)相关联。在待学习对象具有明确、单一的语义,即对象的类别标记唯一时,上述传统监督学习框架已经取得了巨大的成功。真实世界的对象往往并不只具有唯一的语义,而是可能具有多义性的。
在上图的自然场景中,我们难以用唯一的标签去标记它。不管把它归属到哪个类别,都会丧失很多的有效信息。因此,我们引入多标记学习框架去解决这一问题。在多标记学习中每个对象由一个示例描述,该示例具有多个而不再是唯一的类别标记。学习系统的任务是从中学习得到一个多标记分类器,能将所有适合的标记赋予未见示例。
在以往的多标记学习问题中,标记重要度往往是等值的,也就是说,标记y_i对样本的重要度服从二值分布,1表示y