- 博客(1)
- 收藏
- 关注
原创 论文笔记:SimVQA: Exploring Simulated Environments for Visual Question Answering
然后,我们使用不同的方法来缓解真实图像和合成图像之间的领域差距。方法1和2产生一组对齐的特征,方法3增加VQA模型的输出空间(即,答案的token),将真实类输出token和合成类输出token分离。特征交换(F-SWAP):我们提出了一种令人惊讶的简单而有效的新技术,用于在我们的训练中结合合成图像,同时减轻领域偏移。实验结果:我们提供了一个经验分析,使用众所周知的技术,如对抗性增强、领域独立融合和最大均值差异匹配,以缓解与我们提出的方法相比的视觉领域差距,并分析技能之间的知识迁移。2、VQA的数据增强。
2023-06-06 17:38:45
160
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人