YOLO系列研究

周陽讀書

已于 2024-03-12 14:49:13 修改

阅读量110

点赞数

分类专栏：个人经验可供分享深度学习文章标签： YOLO 目标跟踪人工智能

于 2024-03-12 14:29:12 首次发布

本文链接：https://blog.csdn.net/weixi234/article/details/136644449

版权

个人经验可供分享同时被 2 个专栏收录

22 篇文章 4 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

深度学习

5 篇文章 0 订阅

订阅专栏

本文介绍了COCO数据集，一个大型物体检测、分割和字幕数据集，用于YOLO-v3等目标检测算法的研究。COCO数据集包含91个类别，20万张标注图像，主要解决目标检测、上下文关系和精确定位等问题。同时，文章还提到了获取COCO数据集的方法和YOLO-v3的训练数据准备。

摘要由CSDN通过智能技术生成

研究YOLO系列

COCO数据集

coco数据集是一个大型的物体检测、分割和字幕数据集
COCO数据集是一个大型的、丰富的物体检测，分割和字幕数据集。这个数据集以scene understanding为目标，主要从复杂的日常场景中截取，图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标，328,000影像和2,500,000个label。目前为止有语义分割的最大数据集，提供的类别有80 类，有超过33 万张图片，其中20 万张有标注，整个数据集中个体的数目超过150 万个。这就是YOLOV3采用的数据集。
该数据集主要解决3个问题：目标检测，目标之间的上下文关系，目标的2维上的精确定位。COCO数据集有91类，虽然比ImageNet和SUN类别少，但是每一类的图像多，这有利于获得更多的每类中位于某种特定场景的能力，对比PASCAL VOC，其有更多类和图像。

目标检测任务（object Detection Task）框和实例分割（人、球拍）
Stuff Segmentation Task 草地、沙分割
Panoptic Segmentation Task 实景分割
Captioning Challenge 看图说话