opencv如何调用yolov3(Python版)

YOLO是“You Only Look Once”的简称,它虽然不是最精确的算法,但在精确度和速度之间选择的折中,效果也是相当不错。YOLOv3借鉴了YOLOv1和YOLOv2,虽然没有太多的创新点,但在保持YOLO家族速度的优势的同时,提升了检测精度,尤其对于小物体的检测能力。YOLOv3算法使用一个单独神经网络作用在图像上,将图像划分多个区域并且预测边界框和每个区域的概率。
 

 注意:opencv-python 本文使用的版本为4.5.2.52   

 

本文提供的目标检测实时检测代码,也可以使用本地视频

import cv2
import numpy as np

cap = cv2.VideoCapture(0)
whT = 320
confThreshold = 0.5
nmsThreshold = 0.3

classFile = 'classes.txt'
classNames = []
with open(classFile, 'rt') as f:
    classNames = f.read().rstrip('\n').split('\n')
  1. 导入所需的库(OpenCV和NumPy)。
  2. 打开摄像头(ID为0表示默认的摄像头)。
  3. 设置输入图像的大小(whT),置信度阈值(confThreshold)和非最大抑制的阈值(nmsThreshold)。
  4. 从文件中读取类别名称(classNames)。
  5. modelConfiguration = 'yolov3.cfg'
    modelWeights = 'yolov3.weights'
    
    net = cv2.dnn.readNetFromDarknet(modelConfiguration, modelWeights)
    net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV)
    net.setPreferableTarget(cv2.dnn.DNN_TARGET_CPU)
    
    

  6. 加载YOLOv3模型的配置文件(modelConfiguration)和预训练权重文件(modelWeights)。
  7. 创建一个深度学习网络(net)并设置其计算后端(OpenCV)和目标设备(CPU)。
    def findObejects(outputs, img):
        hT, wT, cT = img.shape
        bbox = []
        classIds = []
        confs = []
    
        for output in outputs:
            for det in output:
                scores = det[5:]
                classId = np.argmax(scores)
                confidence = scores[classId]
                if confidence > confThreshold:
                    w, h = int(det[2] * wT), int(det[3] * hT)
                    x, y = int((det[0] * wT) - w / 2), int((det[1] * hT) - h / 2)
                    bbox.append([x, y, w, h])
                    classIds.append(classId)
                    confs.append(float(confidence))
    

  8. 定义函数findObejects,用于从YOLOv3的输出中提取检测结果。
  9. 将输出中的目标框信息(坐标、宽度、高度)、类别ID和置信度进行解析,将符合条件(置信度大于confThreshold)的目标保存到bboxclassIdsconfs列表中。
        # print(len(bbox))
        indices = cv2.dnn.NMSBoxes(bbox, confs, confThreshold, nmsThreshold)
        print(indices)
        for i in indices:
            i = i[0]
            box = bbox[i]
            x, y, w, h = box[0], box[1], box[2], box[3]
            cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 255), 2)
            cv2.putText(img, f'{classNames[classIds[i]]} {int(confs[i]*100)}%',
                        (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 0, 255), 2)
    

  10. 使用非最大抑制(NMS)算法对检测到的目标框进行筛选,去除重叠较多的框。
  11. 遍历通过NMS筛选后的目标框,将其绘制在原始图像上,并在框的上方显示目标类别和置信度。
    while True:
        success, img = cap.read()
        blob = cv2.dnn.blobFromImage(img, 1/255, (whT, whT), [0, 0, 0], crop=False)
        net.setInput(blob)
    
        layerNames = net.getLayerNames()
        outputNames = [layerNames[i[0]-1] for i in net.getUnconnectedOutLayers()]
    
        outputs = net.forward(outputNames)
        findObejects(outputs, img)
    
        cv2.imshow('image', img)
        cv2.waitKey(1)
    

  12. 在一个无限循环中,不断从摄像头中读取图像。
  13. 将图像预处理为网络输入大小的Blob(二进制大型对象)。
  14. 使用YOLOv3模型进行推理,得到输出(outputs)。
  15. 调用findObejects函数进行目标检测,将检测结果绘制在图像上。
  16. 将处理后的图像显示在窗口中,直到按下键盘上的任意键退出循环,完成程序运行。

下面是全部代码,代码需要的配置文件和权重文件我放在百度网盘中

链接:https://pan.baidu.com/s/1zcy0fVQ38NvmM7763mNr7A 
提取码:eo38

import cv2
import numpy as np

# 初始化摄像头捕获
cap = cv2.VideoCapture(0)

# YOLOv3模型参数
whT = 320
confThreshold = 0.5
nmsThreshold = 0.3

# 从文件中加载类别名称
classFile = 'classes.txt'
classNames = []
with open(classFile, 'rt') as f:
    classNames = f.read().rstrip('\n').split('\n')

# 加载YOLOv3模型
modelConfiguration = 'yolov3.cfg'
modelWeights = 'yolov3.weights'
net = cv2.dnn.readNetFromDarknet(modelConfiguration, modelWeights)
net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV)
net.setPreferableTarget(cv2.dnn.DNN_TARGET_CPU)

def findObejects(outputs, img):
    hT, wT, cT = img.shape
    bbox = []
    classIds = []
    confs = []

    # 处理YOLOv3输出,找到超过置信度阈值的目标
    for output in outputs:
        for det in output:
            scores = det[5:]
            classId = np.argmax(scores)
            confidence = scores[classId]
            if confidence > confThreshold:
                # 获取边界框的尺寸,并转换为像素坐标
                w, h = int(det[2] * wT), int(det[3] * hT)
                x, y = int((det[0] * wT) - w / 2), int((det[1] * hT) - h / 2)
                bbox.append([x, y, w, h])
                classIds.append(classId)
                confs.append(float(confidence))

    # 执行非最大抑制,去除重复检测结果
    indices = cv2.dnn.NMSBoxes(bbox, confs, confThreshold, nmsThreshold)

    # 绘制边界框和目标标签
    for i in indices:
        i = i[0]
        box = bbox[i]
        x, y, w, h = box[0], box[1], box[2], box[3]
        cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 255), 2)
        cv2.putText(img, f'{classNames[classIds[i]]} {int(confs[i]*100)}%',
                    (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (255, 0, 255), 2)

while True:
    # 从摄像头获取一帧图像
    success, img = cap.read()

    # 为YOLOv3模型准备图像
    blob = cv2.dnn.blobFromImage(img, 1/255, (whT, whT), [0, 0, 0], crop=False)
    net.setInput(blob)

    # 获取YOLOv3模型的输出层名称
    layerNames = net.getLayerNames()
    outputNames = [layerNames[i[0]-1] for i in net.getUnconnectedOutLayers()]

    # YOLOv3前向推理
    outputs = net.forward(outputNames)

    # 在图像中检测目标并绘制边界框
    findObejects(outputs, img)

    # 显示带有边界框的图像
    cv2.imshow('image', img)
    
    # 当按下 'q' 键时退出循环
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放摄像头并关闭窗口
cap.release()
cv2.destroyAllWindows()

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 要在 OpenCV使用 YOLOv7 模型进行目标检测,你需要首先下载和安装 YOLOv7 模型和权重文件。可以从以下链接获取这些文件: 模型:https://github.com/WongKinYiu/yolov7/tree/master/models 权重:https://github.com/WongKinYiu/yolov7/releases/download/v1.0/yolov7-tiny.pt 然后,你可以使用 OpenCV 中的 `dnn` 模块来加载模型和权重,并将其应用于图像。下面是一个简单的代码示例: ```python import cv2 # 加载模型和权重 model = cv2.dnn.readNetFromDarknet('path/to/yolov7.cfg', 'path/to/yolov7-tiny.weights') # 加载类别标签 with open('path/to/labels.txt', 'r') as f: labels = [line.strip() for line in f.readlines()] # 加载图像 img = cv2.imread('path/to/image.jpg') # 将图像送入模型进行目标检测 blob = cv2.dnn.blobFromImage(img, 1 / 255.0, (416, 416), swapRB=True, crop=False) model.setInput(blob) outputs = model.forward(model.getUnconnectedOutLayersNames()) # 处理模型输出 for output in outputs: for detection in output: scores = detection[5:] class_id = np.argmax(scores) confidence = scores[class_id] if confidence > 0.5: x, y, w, h = detection[:4] * np.array([img.shape[1], img.shape[0], img.shape[1], img.shape[0]]) x, y, w, h = int(x - w / 2), int(y - h / 2), int(w), int(h) cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2) cv2.putText(img, labels[class_id], (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2) # 显示结果图像 cv2.imshow('Image', img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 这个代码示例将 YOLOv7 模型应用于输入图像,并显示检测结果。你需要将 `path/to` 替换为相应的文件路径。 ### 回答2: OpenCV是一个功能强大的计算机视觉库,它提供了许多机器学习算法和计算机视觉技术的实现。使用OpenCV调用Yolov7意味着我们可以利用OpenCV的图像处理功能来执行实时目标检测。 Yolov7是一种使用卷积神经网络(CNN)实现的目标检测算法。它能够识别图像中的多个目标,并准确地标记它们的位置。通过结合OpenCVYolov7,我们可以实现在图像或视频中实时检测目标。 首先,我们需要安装并配置OpenCVYolov7的环境。这包括安装OpenCV库文件和相应的依赖项,以及下载和配置Yolov7的模型文件和权重。 然后,我们可以使用OpenCV提供的函数和方法来读取图像或视频文件,并将其传递给Yolov7的模型。Yolov7将对图像或视频进行处理,并返回检测到的目标及其位置信息。 最后,我们可以使用OpenCV提供的绘制函数将检测结果标记在图像或视频中。这样,我们就可以实时地看到Yolov7检测到的目标以及它们的位置信息。 需要注意的是,调用Yolov7需要一定的计算资源和时间。较大的图像或高分辨率的视频可能需要更长的处理时间。另外,Yolov7的性能还受到硬件设备的限制。 总之,使用OpenCV调用Yolov7可以实现实时目标检测的功能。通过结合这两个强大的工具,我们可以在计算机视觉领域实现更精确和高效的目标识别应用。 ### 回答3: OpenCV是一个开源的计算机视觉库,它可以用来处理图像和视频。Yolov7是一个基于深度学习的目标检测算法,它可以用于检测图像中的不同目标物体。 要在OpenCV调用Yolov7,需要先安装OpenCVYolov7的运行环境。可以通过pip或者conda安装OpenCV,并且根据官方文档安装Yolov7的环境。 安装完成后,可以使用OpenCV的接口来读取图像或者视频,并将其传递给Yolov7进行目标检测。首先,需要加载Yolov7的网络模型,可以使用OpenCV提供的函数来加载预训练的权重文件和配置文件。 然后,将图像或者视频帧传递给Yolov7的网络模型进行推理。可以使用OpenCV提供的函数来调用Yolov7进行目标检测,并得到检测结果。检测结果包括目标的类别、位置和置信度等信息。 最后,可以使用OpenCV的函数将检测结果绘制在原始图像上,并显示出来。可以使用不同的颜色来标记不同类别的目标,并在目标周围绘制矩形框。 通过这样的步骤,就可以实现在OpenCV调用Yolov7进行目标检测。这样可以方便地将目标检测算法与OpenCV的其他功能结合起来,实现更复杂的图像处理任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

陈子迩

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值