Pseudo-Q: Generating Pseudo Language Queries for Visual Grounding, 2022 CVPR

最新推荐文章于 2024-06-21 16:34:15 发布

BachelorSC

最新推荐文章于 2024-06-21 16:34:15 发布

阅读量1k

点赞数 3

分类专栏：读读论文文章标签：人工智能计算机视觉 Paper transformer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43766746/article/details/124687203

版权

该论文提出了一种无监督方法Pseudo-Q，用于减少视觉定位任务对人工标注数据的依赖。通过预训练检测器生成对象提案，Pseudo-Query Generation Module自动生成名词、属性和关系，形成伪查询，构建有监督的训练数据集。在实验中，这种方法在无监督和弱监督设置下均表现出色，能有效减少约30%的人工标注需求。

摘要由CSDN通过智能技术生成

**本文内容仅代表个人理解，如有错误，欢迎指正**

1. Problem & Background Information

1.1 Problem

- 目前，人们基本上都采用基于深度学习的方法来解决Visual grounding任务。不论是全监督学习还是弱监督学习，都十分依赖人为标注的数据集，而人工标注不仅昂贵，还十分费时。因此，本篇论文的目标是减少模型对于人工标注数据的依赖。

1.2 Background Information

- 简单阐述Visual grounding任务背景下的全监督学习与弱监督学习。

- 全监督学习如图一(a)所示，给定Image、Query以及Image中相对应的Bounding box进行训练。

- 弱监督学习如图一(b)所示，仅给定Image、Query进行学习，没有给出图像中相对应的位置。

图一

2. Point

- 个人觉得本篇论文最大的亮点就是其通过无监督的方法构建有监督的学习，但无监督的方法所提供的信息/标签到底可不可靠，另说。主要思想如图二所示，在训练的时候，给定一张没有label的Image，通过Pre-trained detector得到object proposals；通过Pseudo-Query Generation Modul

最低0.47元/天解锁文章

关注

3
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Pseudo-Q: Generating Pseudo Language Queries for Visual Grounding, 2022 CVPR

**本文内容仅代表个人理解，如有错误，欢迎指正**1. Problem & Background Information1.1 Problem- 目前，人们基本上都采用基于深度学习的方法来解决Visual grounding任务。不论是全监督学习还是弱监督学习，都十分依赖人为标注的数据集，而人工标注不仅昂贵，还十分费时。因此，本篇论文的目标是减少模型对于人工标注数据的依赖。1.2 Background Information- 简单阐述Visual grounding任务背景下的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。