已知每个包中的样本类别所占比例,去预测样本真实标签的机器学习任务是一个有趣且重要的研究方向。近年来随着数据的迅猛增长,该方向的研究内容有了更广泛的应用,如基于特征属性的图像目标分类问题、视频事件检测、视频图像中的多分类问题等。
下面是一篇发表在2019年NIPS的关于比例标签学习问题(Learning from label proportions : LLP)的文章。在深度学习理论基础之上,提出了一种基于熵正则化的LLP学习算法,揭示了先验比例信息与类后验概率之间的关系,并提供了与先验比例信息相关的类似然分解表达式,从而证实了最终分类器的存在性及有效性。实验结果表明,该算法达到了到目前为止在该问题上的最优性能。
LLP学习算法示意图
J.Liu, B. Wang, Z. Qi , Y Tian, Y Shi,Learning from Label Proportions with Generative Adversarial Networks. Advances in Neural Information Processing Systems(NIPS), 2019, 7167-7177.
文章链接:https://arxiv.org/abs/1909.02180
文章代码:https://github.com/liujiabin008/LLP-GAN
LLP的具体实例:
1)辅助生殖技术(assisted reproductive technology (ART)):对于辅助生殖技术。 照流程,胚胎需在试管里培育多日。根据国家法律,每次试验,使用的胚胎数量有严格控制。因此ÿ