Opencv之调用DNN模块

最新推荐文章于 2024-07-04 09:18:23 发布

cofisher

最新推荐文章于 2024-07-04 09:18:23 发布

阅读量2.6k

点赞数 4

分类专栏： Opencv 深度学习文章标签：神经网络深度学习 opencv python 计算机视觉

本文链接：https://blog.csdn.net/qq_36758914/article/details/104052322

版权

深度学习同时被 2 个专栏收录

70 篇文章 34 订阅

订阅专栏

Opencv

38 篇文章 29 订阅

订阅专栏

opencv中有dnn模块可以用来直接调用深度学习的配置文件。
下面，举一个物体识别的例子。

举例

1、导入工具包

import utils_paths
import numpy as np
import cv2

2、标签文件处理

rows = open("synset_words.txt").read().strip().split("\n")
classes = [r[r.find(" ") + 1:].split(",")[0] for r in rows]

3、Caffe所需配置文件

net = cv2.dnn.readNetFromCaffe("bvlc_googlenet.prototxt",
    "bvlc_googlenet.caffemodel")

4、图像路径

imagePaths = sorted(list(utils_paths.list_images("images/")))

5、图像数据预处理

函数说明：
blob = cv2.dnn.blobFromImage(image, scalefactor=1.0, size, mean, swapRB=True，crop=False,ddepth = CV_32F )

输入：

image：需要进行处理的图像。
scalefactor：执行完减均值后，需要缩放图像，默认是1。
size：输出图像的空间尺寸,如size=(200,300)表示高h=300,宽w=200。
mean：要减去的均值，可以是R,G,B均值三元组，或者是一个值，每个通道都减这值。如果执行减均值，通道顺序是R、G、B。如果，输入图像通道顺序是B、G、R，那么请确保swapRB = True，交换通道。
swapRB：OpenCV认为图像通道顺序是B、G、R，而减均值时顺序是R、G、B，为了解决这个矛盾，设置swapRB=True即可。
crop：图像裁剪,默认为False.当值为True时，先按比例缩放，然后从中心裁剪成size尺寸。
ddepth：输出blob的深度，可选CV_32F or CV_8U。

返回值：

返回一个4通道的blob(blob可以简单理解为一个N维的数组，用于神经网络的输入)

image = cv2.imread(imagePaths[0])
resized = cv2.resize(image, (224, 224))
# image scalefactor size mean swapRB
# (104, 117, 123)是均值
blob = cv2.dnn.blobFromImage(resized, 1, (224, 224), (104, 117, 123))
print("First Blob: {}".format(blob.shape))

在这里，由于我们训练使用的数据尺寸都是 $224\times 224$ ，所以在测试的时候也要是 $224\times 224$ 。在ImageNet训练集中，三通道的均值分别为：R = 103.93 , G = 116.77, B = 123.68。

6、得到预测结果

net.setInput(blob)
preds = net.forward()

7、排序，取分类可能性最大的

idx = np.argsort(preds[0])[::-1][0]
text = "Label: {}, {:.2f}%".format(classes[idx],
    preds[0][idx] * 100)
cv2.putText(image, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
    0.7, (0, 0, 255), 2)

8、展示结果

cv2.imshow("Image", image)
cv2.waitKey(0)
cv2.destroyAllWindows()

PS：如果想要一次识别多张图片，可使用以下代码。

# Batch数据制作
images = []
# 方法一样，数据是一个batch
for p in imagePaths[1:]:
    image = cv2.imread(p)
    image = cv2.resize(image, (224, 224))
    images.append(image)
# blobFromImages函数，注意有s
blob = cv2.dnn.blobFromImages(images, 1, (224, 224), (104, 117, 123))
print("Second Blob: {}".format(blob.shape))
# 获取预测结果
net.setInput(blob)
preds = net.forward()
for (i, p) in enumerate(imagePaths[1:]):
    image = cv2.imread(p)
    idx = np.argsort(preds[i])[::-1][0]
    text = "Label: {}, {:.2f}%".format(classes[idx],
        preds[i][idx] * 100)
    cv2.putText(image, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
        0.7, (0, 0, 255), 2)
    cv2.imshow("Image", image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

cofisher

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
0
评论
Opencv之调用DNN模块

opencv中有dnn模块可以用来直接调用深度学习的配置文件。下面，举一个物体识别的例子。举例1、导入工具包import utils_pathsimport numpy as npimport cv22、标签文件处理rows = open("synset_words.txt").read().strip().split("\n")classes = [r[r.find(" ")...
复制链接

扫一扫