计算机视觉
文章平均质量分 95
猫先生Mr.Mao
AI技术从业者与爱好者,专注于AIGC、计算机视觉、多模态、大模型、AI绘画、AI视频、数字人、边缘智能等前沿科技成果的研究和技术分享!
展开
-
Yolo-World | 检测一切模型:高效实时开放词汇目标检测
YOLO-World旨在通过视觉语言建模和大规模数据集的预训练来增强 YOLO 的开放词汇检测功能。原创 2024-09-20 21:10:35 · 685 阅读 · 0 评论 -
YOLOv10:毫秒级实时端到端目标检测开源模型
5月25日凌晨,由清华多媒体智能组开发的YOLOv10发布,毫秒级实时端到端目标检测开源模型。原创 2024-09-20 09:09:44 · 1071 阅读 · 0 评论 -
综述 | YOLOv10的起源:YOLO系列的十年全面回顾【YOLOv1-YOLOv10】
在本文中,探讨了从初代YOLOv1到最新的YOLOv10模型的发展历程。同时预测,YOLO的发展将向多模态数据处理转变,利用大语言模型和自然语言处理的进步来增强目标检测系统。原创 2024-08-30 17:42:58 · 650 阅读 · 0 评论