- 博客(7)
- 收藏
- 关注
原创 NIPS2022_Decoupling Classifier for Boosting Few-shot ObjectDetection and Instance Segmentation论文阅读
本文主要研究的是少镜头目标检测(FSOD)和实例分割(FSIS),这需要一个模型能够快速适应具有少量标记实例的新类。由于缺少标签问题,现有方法严重存在偏见分类,这在实例级少射场景中自然存在,并且是由我们首次正式提出的。因此,我们提出了一种令人尴尬的简单但有效的方法,将标准分类器解耦为两个头。这样,模型可以有效地学习新的类,同时减轻了有噪声的负样本的影响。在没有任何额外的计算成本和参数的情况下,我们的模型在FSOD和FSIS任务的PASCAL VOC和MS-COCO基准测试中始终优于其基线和最先进的水平。
2024-03-28 22:10:45 398 1
原创 Dynamic Head论文阅读
其中Fc为c-th通道的特征片,[α1, α2, β1, β2]T = θ(·)为学习控制激活阈值的超函数。θ(·)的实现与[3]类似,首先在L × S维上进行全局平均池化以降低维数,然后使用两个完全连接层和一个归一化层,最后使用移位的sigmoid函数将输出归一化为[−1,1]。其中K为稀疏采样位置的个数,pk +∆pk为自学习的空间偏移量∆pk所移位的位置,以聚焦于一个判别区域,∆mk为自学习的位置pk的重要标量。式中πL(·)、πS(·)、πC(·)分别是作用于维度L、S、C上的三个不同的注意函数。
2024-03-27 21:56:51 421
原创 DINOv、T-Rex、T-Rex2、GLIP、Grounding DINO论文阅读
效果:视觉提示通用分割、视觉提示参照分割、zero-shot视频对象和部分分割出发点:在视觉领域利用LLMs做上下文提示(in-context prompting)贡献:1)我们是第一个扩展来支持通用视觉任务,如开放集通用分割和检测,并实现与基于文本提示的开放集模型相当的性能。2)我们构建了,一个基于视觉上下文提示的参考分词和通用分词的统一框架。这种统一简化了模型设计,并允许我们的模型同时使用语义标记和未标记的数据,以获得更好的性能。
2024-03-27 20:11:53 599
转载 git clone报错:fatal: unable to access‘....‘:could not resolve proxy:http有效解决办法
git clone报错:fatal: unable to accesscould not resolve proxy:http
2022-07-15 16:09:41 1390
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人