大幅提升CLIP图像分类准确率-Tip-Adapter

最新推荐文章于 2025-03-15 09:30:00 发布

whaosoft143

最新推荐文章于 2025-03-15 09:30:00 发布

阅读量2k

点赞数 1

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29788741/article/details/127044105

版权

搬运工装环境之余弄来的勿怪啊为了学习啊国人的ai真的这么厉害了吗

先上代码和论文

论文链接：https://arxiv.org/pdf/2207.09519.pdf
代码链接：https://github.com/gaopengcuhk/Tip-Adapte

一．研究背景

对比性图像语言预训练模型（CLIP）在近期展现出了强大的视觉领域迁移能力，可以在一个全新的下游数据集上进行 zero-shot 图像识别。为了进一步提升 CLIP 的迁移性能，现有方法使用了 few-shot 的设置，例如 CoOp 和 CLIP-Adapter，即提供了少量下游数据集的训练数据，使得 CLIP 能够更好的针对不同的视觉场景做出调整。但是，这种额外的训练步骤会带来不小的时间和空间资源开销，一定程度上影响了 CLIP 固有的快速知识迁移能力。因此，我们提出了 Tip-Adapter，一种不需要额外下游训练并且能很大程度提升 CLIP 准确率的 few-shot 图像分类方法。基于此，我们又提出了一种仅需要少量微调就能达到 state-of-the-art 性能的方案：Tip-Adapter-F，实现了效率和性能的最佳折中。如下表 1 所示，Tip-Adapter 不需要任何训练时间，即可以将 CLIP 在 ImageNet 数据集提升 + 1.7% 准确率（Accuracy），而 Tip-Adapte

最低0.47元/天解锁文章

博客等级

码龄10年

3060
原创

1万+
点赞

1万+
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

运维相关 8篇
各语言 48篇
aiot 379篇
人工智能 2590篇
智能工厂 4篇
音视频 7篇

最新评论

RSRD~
南北275: 数据集显示权限不够，无法下载
扩散模型~合集6
hahhh111: 求问TFMQ-DM里第一张图左半部分的红色虚线是什么意思
嵌入式分享合集105
good_zhao: Up可以看一下语音模块的控制平台通过串口发给单片机执行相应指令的配置吗
CodeAct
互联网搬砖er: 赞了，这个图真好
缺陷检测~建筑外墙
混乱的菜鸟: 请问有数据集链接么

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。