本文来自OPPO互联网技术团队,转载请注名作者。同时欢迎关注我们的公众号:OPPO_tech,与你分享OPPO前沿互联网技术及活动。
零样本学习方法是学术界重要的前沿研究分支之一。
尽管大量科研相关人员已经标注了很多标准数据集。但就算著名如ImageNet,在其千万级数据集中也不过分为21841 个类别,现实世界中已经标注的数据仍然只占少数,且有诸多场景如疾病图像的数据难以大量获取。
故研究在目标域无标注数据的情况下,如何进行有效的学习并进行预测将非常有意义。
以及由于此范式演进的单样本学习&小样本学习(一种解决方案)可在工业界得到有效应用,OPPO互联网技术团队在本文中介绍了一种基于迁移学习范式的零样本学习方法(ZSL),并结合前沿具体介绍若干方法。
- 零样本学习方法:Zero-shot Learning,ZSL下同;
- 单样本学习:One-shot Learning,OSL 下同;
- 小样本学习:Few-shot Learning,FSL 下同。
1. 综述介绍
1.1 ZSL 问题定义
零样本学习方法(ZSL),其定义是:基于可见标注数据集&可见标签集合(seen),学习并预测不可见(unseen,无标注)数据集结果。其中unseen 标签集合是可获得的,seen 标签集合与unseen 标签集合交集为空。
如下图所示流程:
1.2 知识介绍
W Wang, VW Zheng, H Yu et al.(2019)[1]一文中总结将ZSL 研究分为三种模式:CIII、CTII、CTIT三类。
CIII
Class-Inductive Instance-Inductive setting,是指只使用训练实例和seen标签集合来训练模型。
CTII
Class-Transductive Instance-Inductive setting,是指使用训练实例和seen标签集合,外加unseen 标签集合来训练模型;
CTIT
Class-Transductive Instance-Inductive setting&#