Visual Prompt

本文探讨了视觉提示(Visual Prompt)在适应大规模模型中的作用,提出VPT(Visual Prompt Tuning)方法,它在不改变预训练模型参数的情况下,只需更新特定任务的提示和线性头参数,减少了计算量。实验表明,VPT在24个视觉识别任务中有20个任务上优于全面微调。此外,文章还探索了在计算机视觉中使用视觉提示的可能性,以证实其在某些任务和数据集上的有效性。
摘要由CSDN通过智能技术生成

始于NLP

简单来讲,Prompt就是对原来的输入文本进行一定的处理,使得在不改变预训练模型参数的情况下,相应任务的性能变高。例如,原输入文本为:I received the offer from ETH. ,对于文本分类,我们将其修改为I received the offer form ETH, I’m so [MASK];[MASK]可以为一些表示情绪的词,比如happy,那么相对于原文,修改后的句子更容易被分为happy类。如果将其改为I received the offer from ETH. Chinese:[MASK],则对于翻译任务来讲,更容易取得正确的翻译效果。所谓的修改方式在大佬论文中提到的有(如下图):

NLP中的Prompt算法步骤:

Prompt Addition

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值