题目:Positive-Unlabeled Learning With Label Distribution Alignment
基于标签分布对齐的正无标记学习
作者:Yangbangyan Jiang; Qianqian Xu; Yunrui Zhao; Zhiyong Yang; Peisong Wen; Xiaochun Cao; Qingming Huang
摘要
在诸如医学诊断、异常分析和个性化广告等众多领域中,经常会出现只有正样本和未标记样本(Positive-Unlabeled, PU)的数据。由于缺乏任何已知的负样本标签,使得从这类数据中学习二元分类器变得非常具有挑战性。许多最新的方法通过在正样本和未标记数据上分别计算个体风险,重新构造原始分类风险,并显式地最小化将未标记数据分类为负样本的风险。然而,这通常会导致分类器倾向于负预测的偏差,即它们倾向于将大多数未标记数据识别为负样本。在本文中,我们提出了一种标签分布对齐(Label Distribution Alignment, LDA)的PU学习方法来缓解这个问题。具体来说,我们对预测标签的分布与真实标签的分布进行对齐,后者对于给定的类先验是恒定的。通过这种方式&#x