论文相关
文章平均质量分 79
保持姿态
路漫漫
展开
-
知识图谱-数据集
知识图谱常见数据集的一些介绍网址资源链接转载 2022-05-10 14:52:21 · 1441 阅读 · 0 评论 -
VQA相关概念简单整理
VQA指的是,给定一张图片和一个与该图片相关的自然语言问题,计算机能产生一个正确的回答。 显然,这是一个典型的多模态问题,融合了CV与NLP的技术,计算机需要同时学会理解图像和文字文本QA即纯文本的回答,计算机根据文本形式的材料回答问题。与之相比,VQA把材料换成了图片形式,从而引入了一系列新的问题:图像是更高维度的数据,比纯文本具有更多的噪声。 文本是结构化的,也具备一定的语法规则,而图像则不然。 文本本身即是对真实世界的高度抽象,而图像的抽象程度较低,可以展现更丰富的信息,同时也更难被计原创 2021-11-04 15:14:14 · 3247 阅读 · 0 评论