论文阅读笔记：小样本图像分类，Tip-Adapter

S.GJ

已于 2024-04-21 12:11:23 修改

阅读量870

点赞数 6

文章标签：论文阅读笔记

于 2024-04-21 12:02:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39422822/article/details/138029035

版权

目录

一、论文信息

二、Introduction

2、本文工作

三、相关工作

1、Tip-Adapter

2、Tip-Adapter-F

五、实验结果

1、在ImageNet上的对比实验

2、在其他数据集上的对比实验

3、选用不同的CLIP视觉编码器对实验结果的影响

4、消融实验

六、未来工作

一、论文信息

论文标题：Tip-Adapter: Training-free Adaption of CLIP for Few-shot Classification

论文刊物：ECCV, 2022

论文地址：https://arxiv.org/pdf/2207.09519.pdf

论文代码：https://github.com/gaopengcuhk/Tip-Adapter

二、Introduction

1、动机

现有基于CLIP的小样本图像分类方法需要引入额外的训练参数。

2、本文工作

(1) Tip-Adapter。利用key-value cache model，不需要训练，取得了与之前方法相当的性能。

(2) Tip-Adapter-F。更新key-value cache model中的key，需要少量训练，取得了SOTA的结果。

三、相关工作

1、CLIP

CLIP的模型结构包括两个部分，即文本编码器和图像编码器。文本数据和图像数据两者分别通过各自编码器编码后，使用对比学习的思想，将匹配的文本-图像对的Embedding之间的距离拉近，将不匹配的Embedding之间的距离拉远。通过在大量数据集上的预训练，CLIP获得了较强的零样本推理能力。

2、CLIP + FSC

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。