摘要: 针对现有的大多数方法在消歧过程中缺乏对特征空间潜在有用信息的利用和对候选标签不同置信度水平的考虑的问题,本文提出了一种基于稀疏重构消歧的偏标记学习( partial label learning by sparse reconstruction disambiguation,PL-SRD)的新方法,利用特征空间的结构信息促进标签的消歧过程。本文通过对训练样本进行稀疏重构来刻画特征空间的拓扑结构并将其融入到标签消歧过程中;提出一个统一的框架将标签消歧与训练预测模型同时进行。在人工合成和真实数据集上进行的大量实验表明,本文提出的方法比多个现有的偏标记学习算法取得了更好的性能。
- 关键词:
- 弱监督学习 /
- 稀疏重构 /
- 平滑假设 /
- 标签消歧 /
- 偏标记学习 /
- 候选标签 /
- 特征空间 /
- 多分类
偏标记学习(partial label learning, PLL),也被称为模糊标记学习(ambiguous label learning)[1-4]和超级标签学习(superset label learning)[5-6],是弱监督学习的一个重要分支。在偏标记学习中,每个训练示例分配了一组由一个真实标签和一些噪声标签组成的候选标签集,且训练算法不能直接访问示例的真实标签。由于在许多现实场景中标签完全正确的完美数据难以收集,偏标记学习已经被广泛应用于各个领域,如文本挖掘[7]、自动图像标注[3]、医疗诊断[8]、多媒体内容分析[2,9]、生态信息学[6,10]等。