开集识别。传统的模型包括以上两种模型都是闭集识别,即模型知道所有的类别,Zero-shot learning模型中即使训练集和测试集都没有斑马类别的样本,但测试集中包含了斑马类别的描述,这是有用的属性信息。然而开集识别要实现的是训练集和测试集的类别可以有一样,也可以有不一样的,但模型最终能在不提供任何辅助信息的情况下区分出已知类别,同时也能分辨出未知类别并作相应处理。下图是这个领域某篇论文中对深度学习使用数据的定义与分类。
KKCs:具有明确标签的正训练样本(对其他KKCs为负样本),包含相应的伴随信息(语义和属性信息等)的类别
KUCs:被标记为负样本,不必要被划分为一个具体的类别
UKCs:训练时没有可用的样本,但是有可用的伴随信息(语义和属性信息等)
UUCs:训练时没有可用样本,也没有伴随信息(语义和属性信息等)
传统分类只考虑KKCs;Zero-shot learning关注识别UKCs;Few-shot learning看作是Zero-shot learning的扩展,训练时有有限数量的UKCs;开集识别训练时只有KKCs,测试时有UUCs,需要准确分类KKCs同时需要正确的策略拒绝UUCs。