VLP:《视觉-语言预训练》综述

中科院自动化所最新《视觉-语言预训练》综述

转载来自公众号:机器学习算法与自然语言处理

论文标题:

VLP: A Survey on Vision-Language Pre-training

论文链接:https://www.zhuanzhi.ai/paper/426bf1325e3132ff5a4aa1cc90c27f3c

01摘要

在过去几年中,预训练模型的出现将计算机视觉(CV)和自然语言处理(NLP)等单模态领域带入了一个新时代。大量工作表明它们有利于下游单模态任务,并可以避免从头开始训练新模型。那么这样的预训练模型能否应用于多模态任务呢?研究人员已经探索了这个问题并取得了重大进展。本文调查了视觉-语言预训练 (VLP) 的最新进展和新的前沿,包括图像-文本和视频-文本预训练。为了让读者更好地全面掌握 VLP,我们首先从特征提取、模型架构、预训练目标、预训练数据集和下游任务五个方面回顾其最近的进展。然后,我们详

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
视觉语言训练(VLP)是一种结合视觉语言训练模型,它能够学习到视觉语言之间的通用表示。这种模型可以应用于多模态任务,如图像-文本和视频-文本训练VLP模型的发展是计算机视觉和自然语言处理领域的重大进展之一。 VLP模型通过使用不同的训练目标来进行训练。这些训练目标可以分为四类:补全、匹配、时序和特定类型。补全训练目标是指根据给定的部分信息来测缺失的信息,匹配训练目标是指通过比较视觉语言之间的匹配程度来进行训练,时序训练目标是指根据序列中的上下文关系进行训练,特定类型训练目标是指根据特定类型的任务进行训练VLP模型还可以利用下游任务的训练目标来进行训练。例如,对于视觉问答(VQA)和视觉描述(VC)等任务,VLP模型可以使用融合表示并应用全连接层来对定义的答案进行分类。此外,VLP模型还可以通过自回归解码器生成图像或视频的文本描述。 综上所述,视觉语言训练(VLP)是一种结合视觉语言训练模型,它可以用于多模态任务,并通过不同的训练目标和下游任务进行训练。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [综述 | 最新视觉-语言训练综述](https://blog.csdn.net/qq_27590277/article/details/123267583)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [【自然语言处理】【多模态】多模态综述视觉语言训练模型](https://blog.csdn.net/bqw18744018044/article/details/125697252)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值