Detectron2的demo/demo.py文件执行了图片、视频、摄像头的推理演示。根据任务需要,我们通常需要把实例(每个框的位置、置信度、类别)都保存下来。
predictions, visualized_output = demo.run_on_image(img) # 执行推理
print('instances:',predictions['instances'])
# predictions: {'instances': Instances(num_instances=3, image_height=800, image_width=800,
# fields=[pred_boxes: RotatedBoxes(tensor([[ 666.4870, 503.0547, 32.7376, 172.4621, -160.1855],
# [ 393.4711, 393.7946, 20.6047, 93.2997, -166.1729],
# [ 385.8673, 307.7052, 11.7523, 44.7904, -158.7525]],
# device='cuda:0')), scores: tensor([0.9894, 0.9774, 0.9769],
# device='cuda:0'), pred_classes: tensor([1, 1, 1], device='cuda:0')])}
# 获取预测框信息并转换为numpy:
instances = predictions['instances']
pred_boxes = instances.pred_boxes.tensor.to('cpu').numpy()
# pred_boxes.tensor是因为RotatedBoxes对象的初始化参数叫做tensor
# 会得到一个如下所示的二维列表,一行代表一个框,分别为cx,cy,w,h,angle
#[[ 393.4711, 393.7946, 20.6047, 93.2997, -166.1729],
# [ 385.8673, 307.7052, 11.7523, 44.7904, -158.7525]]
scores = instances.scores.to('cpu').numpy()
# 置信度, 如 [0.9894, 0.9774, 0.9769]
pred_classes = instances.pred_classes.to('cpu').numpy()
# 类别,如 [1, 1, 0]
开始弄的时候,不知道怎么根据predictions得到预测框信息,后面单步调试了一下,得到了以上结果,希望可以给做类似任务的码友们节省点时间。