1、没有经过最大值抑制的输出为输出为torch.size([1,18900,85]),输出了18900的框所以需要过滤。
pred = non_max_suppression(pred, conf_thres, iou_thres, classes, agnostic_nms, max_det=max_det)
conf_thres置信度阈值;
iou_thres交并比阈值;
max_det最大检测出的类别,默认超过1000各类别就不显示
2、经过极大值抑制之后输出为[1,5,6],表示检测除了5个框,6代表前4个值为坐标值、第5个为置信度信息、第6个值为所属的类别
3、如果[1,5,6]中的6输出的数值为[672,395,810,878,0.98,0];前四个坐标、第5个为置信度、第六个0在coco数据集中表示人。