使用 YOLOv3 和 COCO 数据集掌握对象检测

最新推荐文章于 2025-03-09 10:20:45 发布

woshicver

最新推荐文章于 2025-03-09 10:20:45 发布

阅读量350

点赞数

文章标签： YOLO 计算机视觉深度学习 opencv 人工智能

本文链接：https://blog.csdn.net/woshicver/article/details/130469006

版权

这篇博客详细讲解了如何利用预训练的YOLOv3模型进行对象检测，特别是在COCO数据集上。通过逐行解析代码，介绍了从加载图像到使用OpenCV展示，再到YOLOv3模型的前向传播，以及对象边界框、类标签和置信度的提取。文章还涵盖了非最大抑制（NMS）算法的应用和结果的可视化展示，提供了完整的代码实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这篇博文中，将针对具有 80 个标签的 coco 数据集逐行解释 Yolov3 预训练对象检测的代码说明。

我们可以从 yolo 官网获取 weights 文件和 cfg 文件：https://pjreddie.com/darknet/yolo/

image = cv2.imread('./testing images/crosswalk-featured.jpg')
#cv2.imshow('image',image)
#cv2.waitKey()
#cv2.destroyAllWindows()
original_with , original_height = image.shape[1] , image.shape[0]

Neural_Network = cv2.dnn.readNetFromDarknet('./Files/yolov3.cfg','./Files/yolov3.weights')
classes_names = []
k = open('./Files/class_names','r')
for i in k.readlines():
    classes_names.append(i.strip())
#print(classes_names)
blob = cv2.dnn.blobFromImage(image , 1/255 , (320,320) , True , crop = False)
#print(blob.shape)
Neural_Network.setInput(blob)
cfg_data = Neural_Network.getLayerNames()
#print(cfg_data)
layer_names = Neural_Network.getUnconnectedOutLayers()
outputs = [cfg_data[i-1] for i in layer_names]
#print(outputs)
output_data = Neural_Network.forward(outputs)
prediction_box , bounding_box , confidence , class_labels = bounding_box_prediction(output_data)
final_prediction(prediction_box , bounding_box , confidence , class_labels , original_with / 320 , original_height / 320 )

第一行从testing images目录中读取图像文件crosswalk-featured.jpg并将其作为数组存储在变量image中。
接下来的两行注释：使用 OpenCV 显示图像
下一行检索图像的尺寸（宽度和高度）并将它们分别存储在original_with和original_height变量中。
cv2.dnn.readNetFromDarknet('./Files/yolov3.cfg','./Files/yolov3.weights')：从 Darknet 框架加载预训练的 YOLOv3 模型。这两个参数分别是配置文件和权重文件的路径。
接下来的几行从文件中读取 C

最低0.47元/天解锁文章