论文相关内容
本文中解决多标记问题的方法:
一种简单而有效的多标签学习方法称为标签幂集(LP),它将训练集中存在的每个不同的标签组合视为单标签分类任务的不同类值。LP的计算效率和预测性能受到具有大量标签和训练实例的应用领域的挑战。在这些情况下,类的数量可能会变得非常大,同时许多类与非常少的训练示例相关联。针对这些问题,本文提出将初始标签集分解为若干个小的随机子集,称为标签集,并利用LP训练相应的分类器。标签集可以是不相交的,也可以是重叠的,这取决于使用哪一种策略来构造它们。该方法称为RAkEL (RAndom k labELsets),其中k是指定子集大小的参数。
RAkELd(相交策略)
标签子集的划分(L为标签集,M为其大小,k为标签子集的标签个数)
预测(简单的结合一下)
RAkELo (重叠策略)
标签子集的划分(L的k次幂为在个数为M的标签集中选取k标签组合的所有空间)
预测(采用投票法)
例子
总结
1、相关背景:多标签学习方法LP的有效性及其相应的挑战(在带有大量标签和训练样例的应用领域上受到挑战)。
2、问题是什么:解决上述挑战并利用LP的方法训练分类器进行多标签分类。
3、现有的解决方案:好像没有(指利用LP进行多标签分类的方法)。
4、作者的核心思想、创新点在哪里:解决了LP的两个挑战一、标签空间大,二、无法处理训练集中没有出现过的样例,通过集成的方式提出了RAkEL的不相交和重叠两种策略解决了上述挑战提升了预测性能。
5、通过什么样的实验进行验证:多个数据集3个多标签对比算法2个评价度量进行的实验验证。
6、对我的启发:聚精会神,堪破虚妄,取精华,为我用。