TPAMI 2024| DualCoOp++：一种快速高效的有限注释多标签识别方法

小白学视觉

于 2024-05-25 23:30:00 发布

阅读量750

点赞数 5

分类专栏：论文解读论文解读 IEEE TPAMI 文章标签：计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42722197/article/details/139161470

版权

论文解读 IEEE TPAMI 同时被 2 个专栏收录

159 篇文章 10 订阅 ¥29.90 ¥99.00

订阅专栏

33 篇文章 36 订阅

订阅专栏

DualCoOp++是一种针对多标签图像识别的快速适应方法，尤其适用于有限注释的情况。它利用预训练的视觉语言模型，通过学习证据、正面和负面提示，实现更准确的类别识别。引入的证据引导区域特征聚合和赢家通吃正则化模块提高了区分相似类别的能力，同时避免了额外计算开销。在MS-COCO、VOC2007和NUS-WIDE等数据集上的实验表明，DualCoOp++在部分标签和零样本识别任务上均优于现有方法。

摘要由CSDN通过智能技术生成

题目：DualCoOp++: Fast and Effective Adaptation to Multi-Label Recognition With Limited Annotations

DualCoOp++：一种快速高效的有限注释多标签识别方法

作者：Ping Hu；Ximeng Sun；Stan Sclaroff；Kate Saenko

摘要

在低标签状态下的多标签图像识别是一项极具挑战性和实际意义的任务。之前的工作主要集中在学习文本和视觉空间之间的对齐，以弥补图像标签的不足，但由于高质量多标签注释的缺乏，可能会导致精度下降。在这项研究中，我们利用了通过数百万辅助图像-文本对预训练的强大文本和视觉特征对齐能力。我们引入了一种高效的框架，称为证据引导的双上下文优

了解本专栏

小白学视觉

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
TPAMI 2024| DualCoOp++：一种快速高效的有限注释多标签识别方法

在低标签状态下的多标签图像识别是一项极具挑战性和实际意义的任务。之前的工作主要集中在学习文本和视觉空间之间的对齐，以弥补图像标签的不足，但由于高质量多标签注释的缺乏，可能会导致精度下降。在这项研究中，我们利用了通过数百万辅助图像-文本对预训练的强大文本和视觉特征对齐能力。我们引入了一种高效的框架，称为证据引导的双上下文优化 (DualCoOp++)，作为解决部分标签和零样本多标签识别的统一方法。在 DualCoOp++ 中，我们分别为目标类别编码证据、正面和负面上下文，作为语言输入的参数化组件（即提示）。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小白学视觉 您的赞赏是我们坚持下去的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。