参考视频:41 物体检测和数据集【动手学深度学习v2】_哔哩哔哩_bilibili
一、边界框
查看图片
d2l.set_figsize()
img = d2l.plt.imread("/home/wujiqing/PythonProject/Helloworld/image/catdog.png")
d2l.plt.imshow(img)
d2l.plt.show()
边界框描述的三种方式:
1.左上坐标,右下坐标
2.中间坐标,高度,宽度
3.左上坐标,右下坐标,小数
根据坐标信息定义图中边界框
dog_bbox= [10.0, 5.0, 230.0, 280.0]
cat_bbox=[235.0, 60.0, 430.0, 280.0]
将边界框在图中画出
#定义一个辅助函数bbox_to_rect。 它将边界框表示成matplotlib的边界框格式
def bbox_to_rect(bbox, color):
# 将边界框(左上x,左上y,右下x,右下y)格式转换成matplotlib格式:
# (