点击我爱计算机视觉标星,更快获取CVML新技术
分享一篇今天新出的论文DivideMix: Learning with Noisy Labels as Semi-supervised Learning,来自SalesForce研究院的工程师提出一种使用半监督学习方法改进含噪声标签数据的学习,显著改进了精度,大幅超越之前的State-of-the-art。
该文作者信息:
众所周知,近年来深度学习的长足进步离不开大规模高标准的标注数据,但在大多数现实问题中,获得数量可观的标注数据需要付出大量的时间和金钱代价。
而互联网上可以获得大量的含有标签噪声的数据,比如从搜索引擎查找返回的数据、从社交网络下载的含有tag的数据等,如何利用这些大规模含噪声标签的数据是降低标注成本的重要方向。
该文提出DivideMix方法,核心思想为 co-divide + 改进的MixMatch,其算法流程如下:
1. 提出了co-divide,该过程同时训练两个网络。对于每个网络,在其