文章题目
Active Learning with Partial Feedback
发表出处
ICLR 2019
一作单位
卡耐基梅隆大学(Carnegie Mellon University)
主要思想
利用主动学习的思想,学习器learner每次问一个“yes or no”
的问题,标注者(annotator)每次回答这一二分类问题,学习器再考虑是否继续提问。
如果一直提问的话就可以得到示例instance
的真实标记(ground truth value
);
如果不再提问的话就相当于为该样本构建一个partial labels
,一般翻译为偏标记。
本文提出的方法使得标注代价比较小的情况下就达到了不错的性能效果。
基本方法
1.从偏标记中学习 Leanring from Partial Labels
利用了深度学习中的方法,根据标记的softmax输出进行判断,具体loss如下:
2. 查询策略 Sampling Strategy
本文利用了三种方法:
(1)Expected Information Gain (EIG):计算熵值
(2)Expected Remaining Classes (ERC):查询剩下的类别数量最少的样本
(3)Expected Decrease in Classes (EDC):
算法伪代码:
实验部分
用最少的提问次数得到:
(1)准确的top1 accuracy
(2)准确的标注样本
(3)最少的还未提问的类别
相同标注代价下准确率比其他方法高。