CVPR2024《YOLO-World: Real-Time Open-Vocabulary Object Detection》 本文提出了YOLO-World,通过视觉语言建模和大规模数据集的预训练,增强了YOLO在OpenVocabulary领域的检测能力。同时,该方法可以 zero-shot检测大范围目标的优点,且效率高。
2023CVPR《Observation-Centric SORT:Rethinking SORT for Robust Multi-Object Tracking》 OC-SORT总结了SORT的局限性,并提出了解决方法,最后提出了一种用于目标具有相似的运动属性、相似外观和非线性运动的多目标跟踪方法。
《Grounding DINO:Marrying DINO with Grounded Pre-Training for Open-Set Object Detection》 Grounding DINO将基于Transformer的检测器DINO与 grounded pre-training相结合,提出了一种开放集对象检测器,即可以检测人类通过Prompt输入的任意对象。
《FairMOT: On the Fairness of Detection and Re-Identification in MultipleObject Tracking》 FairMOT: On the Fairness of Detection and Re-Identification in MultipleObject Tracking;将检测和Re-ID统一到同一个网络架构中,提高了算法的性能。
CVPR2022《Unified Transformer Tracker for Object Tracking》 Unified Transformer Tracker for Object Tracking;作者设计了一个统一的目标跟踪架构,该架构可以同时用于SOT和MOT任务
CVPR2022《MeMOT: Multi-Object Tracking with Memory》 MeMOT: Multi-Object Tracking with Memory;一种具有记忆功能的多目标跟踪算法