Visual Prompt Tuning笔记

最新推荐文章于 2024-06-04 19:01:12 发布

雨休

最新推荐文章于 2024-06-04 19:01:12 发布

阅读量451

点赞数

文章标签：迁移学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46261292/article/details/130174053

版权

Introduction

对于大多数识别任务来说，大多数的精确结果是来自基础模型在全新数据上训练的结果，但将大型模型应用在下游任务本身就是一个需要解决的问题。
现有的策略是用full fine-tuning预训练，这种方式需要为每个任务存储部署大量骨干参数，非常耗费资源。而Transformer恰好参数远大于卷积神经网络，更浪费。
作者的方法只在输入空间中引入少量特定于任务的可学习参数，同时在下游训练期间冻结整个预训练的Transformer骨干，结果对24种下游识别任务都有不错的表现。

Related Work

Transformer
Transformer相比于卷积会有更优越的性能以及各大的规模，那么如何将Transformer应用在不同视觉任务上就成为了难题。
Transformer learning
迁移学习一般针对卷积神经网络，很少有人关注到Vision Transformer的应用以及之前迁移学习的方法表现情况

Approach

1.输入图片被分为m个相同大小的hw的patches(VIT中224224的图片被分为1616大小的patches，共196个)
2.每个patch经过embed变为包含位置信息的d维向量（d=16163=768），总体为196768

3.将patch加上d维的CLS，总体为197*768

4.VPT-Shallow
5.
5.VPT-Deep
在这里插入图片描述

Experiments

消融实验
在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
Visual Prompt Tuning笔记

对于大多数识别任务来说，大多数的精确结果是来自基础模型在全新数据上训练的结果，但将大型模型应用在下游任务本身就是一个需要解决的问题。现有的策略是用full fine-tuning预训练，这种方式需要为每个任务存储部署大量骨干参数，非常耗费资源。而Transformer恰好参数远大于卷积神经网络，更浪费。作者的方法只在输入空间中引入少量特定于任务的可学习参数，同时在下游训练期间冻结整个预训练的Transformer骨干，结果对24种下游识别任务都有不错的表现。
复制链接

扫一扫

雨休 CSDN认证博客专家 CSDN认证企业博客

码龄4年

68: 原创

38万+: 周排名

2万+: 总排名

2万+: 访问

: 等级

1060: 积分

252: 粉丝

369: 获赞

23: 评论

323: 收藏

私信

关注

热门文章

分类专栏

自动驾驶+扩散生成模型 1篇
Java基础 19篇

最新评论

【CLIP-FO3D: Learning Free Open-world 3D Scene Representations from 2D Dense CLIP】论文笔记
X-funbean: 可惜没有代码
【JavaSE复习】基础、面向对象
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
【MagicDrive环境配置】新手配俩星期版
起酥~: 跑通了，写了个博客，有问题再讨论哈 https://blog.csdn.net/qq_42390752/article/details/138539067
【MagicDrive环境配置】新手配俩星期版
雨休: 两个推理我也跑通了，如果你训练也没问题了能告诉我一下么，我想再参考一下
【MagicDrive环境配置】新手配俩星期版
起酥~: 我已经安装好所需的包，因为两个推理部分都跑通了，环境没应该是好的。如果针对我训练时出现的问题有研究意愿的可以联系我，我可以分享完整环境的docker镜像。大家一起把这个代码跑通！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。