目标检测研究
文章平均质量分 95
乄洛尘
2024年6月份博士毕业,现在已经在工作了,做计算机视觉、机器视觉的工作(*^▽^*)~
如有问题请留言或私信,笔者看到后会第一时间回复呦~
论文阅读笔记系列保持不定期更新,稳定更新的话估计得等我成为自由职业者吧~
展开
-
开放词汇视觉定位 OV-VG: A Benchmark for Open-Vocabulary Visual Grounding 论文笔记
开放词汇检测旨在检测那些未出现在预定词汇中的目标,类似的任务有视觉定位 Visual Grounding (VG)。然而当前的基础模型虽然在很多视觉语言任务上表现很好,但是在开放视觉定位 open-vocabulary visual grounding (OV-VG) 上还没有拿得出手的工作。原创 2023-10-29 19:22:13 · 1236 阅读 · 1 评论 -
开放目标检测Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection 论文阅读笔记
本文提出一个开放目标检测器 Grounding DINO,采用基于 Transformer 的 DINO 框架+预训练,能够检测任意输入类别或表达式对应的目标。开放目标检测的关键在于引入语言到一个闭集的检测器中,从而实现开放的概念泛化。于是本文提出将闭集的检测器划分为三个阶段并提出一种轻量化的融合方法,包含一个特征增强器,一个语言引导的 query 选择,一个跨模态的检测器用于跨模态融合。之前的工作主要评估模型在新类别上的性能,而本文也提出在指代表达式理解进行评估。原创 2023-10-08 20:36:30 · 2529 阅读 · 4 评论 -
目标检测序列化 Pix2Seq: A Language Modeling Farmework for Objection Dection 论文笔记
好久都没写论文相关的博客了,最近苦于调参。抽空看了一下这篇有新意的论文。将之前目标检测的通用范式:预测回归框的位置,变成直接预测目标的位置。论文框架简单,很管用。原创 2022-05-27 22:26:04 · 592 阅读 · 0 评论 -
多类别目标计数 Towards Partial Supervision for Generic Object Counting in Natural Scenes 论文笔记
趁热打铁,赶紧多看论文啊,开春正是学习的好机会~原创 2022-03-07 21:25:03 · 4440 阅读 · 3 评论 -
类别感知目标计数:Class-aware Object Counting 论文笔记
开学归来,正式复工~ 这是一篇多类别目标计数的文章,思路清晰,但公式表达的不是太好(有点云里雾里的),暂未开源。原创 2022-03-05 22:16:47 · 1402 阅读 · 0 评论 -
多类别目标计数 Dilated-Scale-Aware Category-Attention ConvNet for Multi-Class Object Counting 论文笔记
过年在家,工作时间减少了很多,玩的也很嗨,花零散时间读完了这篇论文及代码,抽空做个总结。该论文写的是多类别目标计数,思路稍显复杂,改进的空间应该蛮多的。原创 2022-02-03 21:58:12 · 3238 阅读 · 0 评论 -
You only need to look at once 系列用于目标计数?——Object Counting:You Only Need To Look At One论文笔记
这是第二篇关于目标计数的文章,站在上一篇少样本计数的肩膀上,思路比较简单,重点在于模型的搭建,创新点也是比较足。原创 2021-12-29 10:13:21 · 2473 阅读 · 0 评论 -
为了统计一切出现在图像上的目标类别的计数:Learning To Count Everything 论文笔记
这是一篇关于目标计数的文章,5月份CVPR出来的时候看过了,这里总结一下,为下一篇做铺垫。代码试过了,比较管用。强推!原创 2021-12-26 15:15:51 · 5304 阅读 · 12 评论 -
FCOS:Fully Convolutional One-Stage Object Detection 论文笔记
FCOS:Fully Convolutional One-Stage Object Detection 论文笔记一、Abstract二、引言三、相关工作1、Anchor-based Detectors2、Anchor-free Detectors四、方法4.1 Fully Convolutional OneStage Object Detector神经网络的输出部分:损失函数推理4.2 Multilevel Prediction with FPN for FCOS4.3 Centerness for FCO原创 2021-10-15 14:39:40 · 150 阅读 · 0 评论 -
LSnet:Location-Sensitive Visual Recognition with Cross-IOU Loss 主要源码解读 1
LSnet:Location-Sensitive Visual Recognition with Cross-IOU Loss主要源码解读一、框架搭建二、网络主体解读1、extrace_features2、lsnet.py解读写在前面照例。每次写博文的时候来个介绍。LSnet是目标检测中基于anchor-free的检测方法。单单读论文并不能领悟其中一些特定的代码设计之巧妙。遂写下这篇博文以记之~论文链接:Location-Sensitive Visual Recognition with Cross-原创 2021-07-07 19:01:45 · 1149 阅读 · 0 评论 -
目标检测+实例分割+姿态估计三合一:LSNet: Location-Sensitive Visual Recognition with Cross-IOU Loss论文笔记
目标检测+实例分割+姿态估计三合一:LSNet: Location-Sensitive Visual Recognition with Cross-IOU Loss论文笔记一、Abstract二、引言三、相关工作四、方法描述1、Location Sensitive Visual Recognition2、LSNet: A Unified Framework3、Cross IOU Loss4、Pyramid DCN五、实验1、Dataset and Evaluation Metrics2、Implementa原创 2021-06-29 20:35:03 · 2413 阅读 · 0 评论