LIFT: Multi-Label Learning with Label-Specific Features

LIFT算法是首个探讨标签特定特征在多标签学习中应用的文章,它采用了一阶方法,不考虑标签间相关性。通过将每个标签视为独立的二分类问题,对正负样本进行聚类分析,获取标签特定的特征。针对类别不平衡问题,LIFT设定正负样本等量的聚类数。聚类中心作为新特征,用于构建SVM分类器。这种方法虽未处理标签相关性,但提出了利用聚类构建新特征的洞察。
摘要由CSDN通过智能技术生成

LIFT: Multi-Label Learning with Label-Specific Features笔记整理

背景

这篇为论文是Label-Specific Features在多标签应用的开篇之作
因为这篇文章较为简单,直入主题看作者如何构建标签具体的特征

THE LIFT APPROACH

在这里插入图片描述
首先这篇文章是一个first-order的多标签算法,意味着其没有考虑标签的相关性,而是一个标准的BR算法。因此作者将N个标签分开考虑。
首先对于第k的标签,作者现将其分类正样本和负样本。
之后作者利用聚类分类来获取 P k P_{k} Pk N k N_{k} Nk的额外信息,这里是作者最终的一个insight。我们来看作者如何说的:

To gain insights on the properties of P k P_{k} Pk and N k N_{k} Nk, LIFT chooses to employ clustering techniques which have been widely used as stand-alone tools for data analysis.

Insight:我们来看看其中的逻辑关系,因为作者需要将多标签问题建立一个模型,因此最简单的一个方法就是将其变为多个二分类问题。之后,为了构建label-specific feature,作者采用了聚类分析。这里有一个潜在的点需要注意,也是本文的核心所在。由于对于每个标签来说,正样本集 P k P_{k} Pk和负样本集 N k N_{k} Nk是不同的,因此在聚类分析的时候,每个标签下的聚类结果是不同的,这就导致了每个标签获得的特征是不同的。
Note:
1.先说一下这个方法的缺点之一就是没有考虑标签之间的一个相关性问题,这是显而易见的。

大家都知道,聚类算法像K-means的一个问题就是聚类个数很难确定,这里作者用一个ratio和样本数量来确定聚类中心,这是一个启发式的算法。另外作者另外一个Insight就是类不平衡问题的解决,为了解决这个问题,作者将正负样本的聚类个数化为相同。
在这里插入图片描述

Multi-label learning tasks usually encounter the issue of class-imbalance [59], where the number of positive instances for each class label is much smaller than the number of negative ones, i.e. |Pk| ≪ |Nk|. To mitigate potential risks brought by the class-imbalance problem, LIFT sets equivalent
number of clusters for Pk and Nk, i.e. m+k = mk = mk. In this way, clustering information gained from positive instances as well as negative instances are treated with equal importance.

之后作者根据正样本和负样本的数量来确定聚类的中心
在这里插入图片描述

之后就是label-specific feature构建的关键,作者利用聚类中心和样本的距离作为一个新的特征集合。
在这里插入图片描述

Cluster centers identified by the k-means algorithm characterize the underlying structure of the training instances with regard to l k l_{k} lk, which can be served as appropriate building blocks (prototypes) for the construction of label-specific features.

其实这种构建新的特征集的想法在其他文章也见很多了,因此可以算一个insight。

Note:
1.作者根据聚类中心构建了新的特征集合。这种想法能否迁移到其他领域当中。比如异质图,我们构建一个Struct-Specific feature来构成新的数据集,然后再进行分类。本质上就是改变节点的特征。
或者根据分层的思想,将其考虑为多个层,每个层一个具体的特征,然后将其构建多层的一个分类器,就是每一层一个特征集合,然后将每一层的特征集合
Layer-Specific feature最后结合起来进行总体分类。

最后作者就是利用一个SVM分类器构建了K个分类器,这没啥说的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值