[x, y, width, height]--在我们的训练数据集中就是这种情况(也叫COCO格式)。
[x1, y1, x2, y2] - 我们在BBox增强阶段创建的格式化版本,也叫[xmin, ymin, xmax, ymax]。这个格式在SSD/RCNN/Fast RCNN/Faster RCNN模型中使用。
[x_center, y_center, width, height] - 这是YOLO格式,或者说是使用YOLO模型训练时使用的格式。x_center, y_center是边界框中心的标准化坐标,width, height是图像的标准化宽度和高度。
Example1:
annotations 数据格式:[{'x': 641, 'y': 634, 'width': 74, 'height': 71}]
变成coco_bbox [[641, 634, 74, 71]]
数据处理:
train_df["coco_bbox"] = train_df["annotations"].apply(lambda annot: [list(item.values()) for item in eval(annot)])