目标检测yolo, voc, coco的BBox格式转换

fwu11

已于 2022-02-03 17:22:31 修改

阅读量5.2k

点赞数 3

分类专栏：工作文章标签：目标检测计算机视觉深度学习

于 2022-01-17 09:48:34 首次发布

本文链接：https://blog.csdn.net/weixin_42552135/article/details/122533582

版权

本文介绍了目标检测中常用的三种BBox（边界框）格式——YOLO、VOC和COCO，并提供了它们之间的转换函数。YOLO格式使用中心坐标和宽高，归一化到0-1范围；VOC格式使用左上和右下角坐标；COCO格式则采用左上角坐标和宽度、高度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

yolo, voc, coco bbox格式互转函数

yolo: [xmid, ymid, w, h]，归一化到0-1

voc: [x1, y1, x2, y2]

coco: [xmin, ymin, w, h]

def voc2yolo(bboxes, image_height=720, image_width=1280):
    """
    voc  => [x1, y1, x2, y2]
    yolo => [xmid, ymid, w, h] (normalized)
    """
    
    bboxes = bboxes.copy().astype(float) # otherwise all value will be 0 as voc_pascal dtype is np.int
    
    bboxes[..., [0, 2]] = bboxes[..., [0, 2]]/ image_width
    bboxes[..., [1, 3]] = bboxes[..., [1, 3]]/ image_height
    
    w = bboxes[..., 2] - bboxes[..., 0]
    h = bboxes[..., 3] - bboxes[..., 1]
    
    bboxes[..., 0] = bboxes[..., 0] + w/2
    bboxes[..., 1] = bboxes[..., 1] + h/2
    bboxes[..., 2] = w
    bboxes[...,