【ECCV 2022】Visual Prompt Tuning

本文提出视觉提示调优(VPT),一种仅更新输入空间少量参数的预训练Transformer模型调优策略。VPT在保持模型主干冻结的同时,通过学习特定任务的视觉提示,实现了在多个下游视觉识别任务上的优秀性能,超越完全微调并降低存储成本。VPT在不同数据规模和Transformer规模下表现优越,尤其在低数据环境下效果显著。
摘要由CSDN通过智能技术生成

论文简介:

目前采用预训练模型的方法包括更新所有的主干参数,即完全微调。本文则介绍了视觉提示调优(VPT)作为一种有效的大型 Transformer 模型的替代方案。VPT 从有效调优大型语言模型的最新进展中获得灵感,在输入空间中只引入了少量(少于模型参数的1%)的可训练参数,同时保持模型主干冻结。对各种下游识别任务的广泛实验表明,与其他参数高效的调优协议相比,VPT获得了显著的性能提高。最重要的是,在许多情况下,VPT在跨模型容量和训练数据规模的情况下甚至优于完全微调,同时降低了每个任务的存储成本。

论文介绍:

本文探索了一条不同的模型迁移路线,即不修改或微调预先训练过的 Transformer 本身,而是修改到 Transformer 的输入。从 NLP 中 Prompt 的最新进展的启发,本文提出了一种新的简单有效的方法,将 Transformer 模型用于下游视觉任务(图1(b)),即视觉提示调优(VPT)。

在这里插入图片描述

VPT 只在输入空间中引入了少量特定于任务

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BIT可达鸭

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值