COCO 数据集是一个大型数据集,里面包含了包括 object detection, keypoints estimation, semantic segmentation,image caption 等多个任务所需要的图像数据及其标注信息。
以MS COCO 2017为例,一共 25G 左右的图片和 1.5G 左右的 annotation 文件,annotation 文件的格式为 .json 格式,存储了所有图片中的目标类别 (总共 80 类),目标 bounding box 的精确坐标以及目标的分割轮廓信息等。
完整的COCO2017数据集下载好并解压缩后应包含以下几部分:
Darknet 成名于YOLO目标检测框架的提出,它是一个用 C 语言和 CUDA 编写的开源神经网络框架,目前基于 darknet 实现的目标检测算法 YOLOv1,YOLOv2 和YOLOv3 在目标检测领域有一定的优势,是One-Stage目标检测算法的代表之一。
本文所需要用到Python脚本代码可以在Github上找到:https://github.com/ChriswooTalent/COCO_forYOLO 。
共包含 4 个 python 脚本:
① batch_split_annotation_foryolo.py: 批处理解析 coco 注释文件,将整体的注释文件分离成每个图像单个的注释文件;
②split_annotation_foryolo.py:分离数据文件的执行部分,在 batch_split_annotation_foryolo 中会调用;
③create_JEPG_dir.py: 将所有训练图像,验