- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Counterfactual Samples Synthesizing for Robust Visual Question Answering相关知识和理解
首先是生成对抗网络GAN,然后关于减轻语言偏见的方法有:1)基于对抗的,2)基于融合的,最后是关于CSS(反事实的)生成对抗网络GAN首先生成对抗网络的想法是:生成网络G尽量生成真实的图片去欺骗辨别网络D,辨别网络D尽量辨别出G生成的假图像和真实图像,二者对抗进行,提高模型性能。其缺点在于:1)不适合文本的离散数据,2)不容易找到对抗后的平衡点,3)训练过程不稳定。基于嵌入的减少语言偏见的方法:基于对抗的方法去减轻语言偏见的方法是,用仅问题模型和普通VQA模型对抗,在训练VQA模型的时候同时训练仅问
2020-11-09 12:01:19 581 1
原创 知识推理的VQA小结
Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources参考链接特点:缺点:FVQA: Fact-based Visual Question Answering参考链接特点:缺点:Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering
2020-11-03 10:54:06 1137
原创 论文阅读:Mucko: Multi-Layer Cross-Modal Knowledge Reasoning for Fact-based Visual Question Answering
参考连接:浙大一博士博客论文链接:https://arxiv.org/pdf/2006.09073代码链接:https://github.com/astro-zihao/mucko发表会议:IJCAI 2020一,介绍在阅读本文之前,请先阅读下面几篇论文:论文1,Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources参考博客,论文地址,论文2,FVQA: Fac
2020-11-02 18:22:16 2041 5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人