3.5.目标检测和数据集

lsslcj

于 2024-07-30 21:08:38 发布

阅读量25

点赞数 1

分类专栏： ai相关文章标签：目标检测人工智能计算机视觉深度学习

本文链接：https://blog.csdn.net/shiki217_/article/details/140806798

版权

ai相关专栏收录该内容

25 篇文章 1 订阅

订阅专栏

目标检测

用框框住目标，可以用几个数字表示框

4个数字：左上角和右上角的横纵坐标
4个数字：边框中心的横纵坐标和框的宽度和高度

1.边界框

两种表示方法转换方法：

#@save
def box_corner_to_center(boxes):
    """从（左上，右下）转换到（中间，宽度，高度）"""
    x1, y1, x2, y2 = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
    cx = (x1 + x2) / 2
    cy = (y1 + y2) / 2
    w = x2 - x1
    h = y2 - y1
    boxes = torch.stack((cx, cy, w, h), axis=-1)
    return boxes

#@save
def box_center_to_corner(boxes):
    """从（中间，宽度，高度）转换到（左上，右下）"""
    cx, cy, w, h = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
    x1 = cx - 0.5 * w
    y1 = cy - 0.5 * h
    x2 = cx + 0.5 * w
    y2 = cy + 0.5 * h
    boxes = torch.stack((x1, y1, x2, y2), axis=-1)
    return boxes

随便定义一下框的边界：

# bbox是边界框的英文缩写
dog_bbox, cat_bbox = [60.0, 45.0, 378.0, 516.0], [400.0, 112.0, 655.0, 493.0]

转换，验证一下：

boxes = torch.tensor((dog_bbox, cat_bbox))
box_center_to_corner(box_corner_to_center(boxes)) == boxes

将边界框在图中画出：

def bbox_to_rect(bbox, color):
    # 将边界框(左上x,左上y,右下x,右下y)格式转换成matplotlib格式：
    # plt绘制矩形的格式：((左上x,左上y),宽,高)
    return d2l.plt.Rectangle(
        xy=(bbox[0], bbox[1]), width=bbox[2]-bbox[0], height=bbox[3]-bbox[1],
        fill=False, edgecolor=color, linewidth=2)

画一下

fig = d2l.plt.imshow(img)
fig.axes.add_patch(bbox_to_rect(dog_bbox, 'blue'))
fig.axes.add_patch(bbox_to_rect(cat_bbox, 'red'));

2. 目标检测数据集

每行表示一个物体：图片文件名，物体类别，边缘框(同一类物体可能出现多次)

COCO:80个物体，330K图片，1.5M物体

lsslcj

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3.5.目标检测和数据集

用框框住目标，可以用几个数字表示框。
复制链接

扫一扫

专栏目录