in-domain和out-of-domain
域内数据和域外数据是根据数据采集的性质而言的,经常出现在域适配问题之中。比如在图文统一表征的工作中,例如文献[2],作者采用的数据集是COCO Captions,VG Dense Captions和Conceptual Captions,SBU Captions,因为前两个数据集包含的图片数据是来自于COCO和VG数据集的,而大部分的Visual+Language任务都会基于这两大类型的数据集去构建测试集,因此我们把前两个数据集称之为域内数据(in-domain),而后两个称之为域外数据(out-of-domain)。通常来说域内数据因为适配更好,效果通常也更好。