in-domain和out-of-domain
域内数据和域外数据是根据数据采集的性质而言的,经常出现在域适配问题之中。比如在图文统一表征的工作中,例如文献[2],作者采用的数据集是COCO Captions,VG Dense Captions和Conceptual Captions,SBU Captions,因为前两个数据集包含的图片数据是来自于COCO和VG数据集的,而大部分的Visual+Language任务都会基于这两大类型的数据集去构建测试集,因此我们把前两个数据集称之为域内数据(in-domain),而后两个称之为域外数据(out-of-domain)。通常来说域内数据因为适配更好,效果通常也更好。


这篇博客探讨了域内数据(in-domain)和域外数据(out-of-domain)的概念,特别是在图文统一表征的任务中。文章引用了COCOCaptions等数据集作为例子,指出域内数据由于与常见测试集匹配度高,通常能取得更好的效果。
1146

被折叠的 条评论
为什么被折叠?



