自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 Counterfactual Samples Synthesizing for Robust Visual Question Answering相关知识和理解

首先是生成对抗网络GAN,然后关于减轻语言偏见的方法有:1)基于对抗的,2)基于融合的,最后是关于CSS(反事实的)生成对抗网络GAN首先生成对抗网络的想法是:生成网络G尽量生成真实的图片去欺骗辨别网络D,辨别网络D尽量辨别出G生成的假图像和真实图像,二者对抗进行,提高模型性能。其缺点在于:1)不适合文本的离散数据,2)不容易找到对抗后的平衡点,3)训练过程不稳定。基于嵌入的减少语言偏见的方法:基于对抗的方法去减轻语言偏见的方法是,用仅问题模型和普通VQA模型对抗,在训练VQA模型的时候同时训练仅问

2020-11-09 12:01:19 581 1

原创 知识推理的VQA小结

Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources参考链接特点:缺点:FVQA: Fact-based Visual Question Answering参考链接特点:缺点:Out of the Box: Reasoning with Graph Convolution Nets for Factual Visual Question Answering

2020-11-03 10:54:06 1137

原创 论文阅读:Mucko: Multi-Layer Cross-Modal Knowledge Reasoning for Fact-based Visual Question Answering

参考连接:浙大一博士博客论文链接:https://arxiv.org/pdf/2006.09073代码链接:https://github.com/astro-zihao/mucko发表会议:IJCAI 2020一,介绍在阅读本文之前,请先阅读下面几篇论文:论文1,Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources参考博客,论文地址,论文2,FVQA: Fac

2020-11-02 18:22:16 2041 5

视觉问答中所有语言先验,偏见的论文,代码,ppt

视觉问答中所有语言先验,偏见的论文,代码,ppt

2021-04-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除