使用 OpenCV 收集数据

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

OpenCV 是“开源计算机视觉”的缩写,是一个机器学习库,旨在实现图像处理和计算机视觉应用。与对象检测和识别相反,OpenCV 还有一个应用是它收集数据的能力。更准确地说,它可以通过在你的机器中本地保存图像来创建数据集。请允许我详细说明。

这是一个简单的代码片段。(我将使用 Python v 3.9.7 进行演示)

导入库:我们需要 Python 的 OpenCVOS 库来执行数据收集。如果你没有预先安装这些软件包,你可以通过在命令提示符中执行以下命令来安装它们:

  • OpenCV: pip install opencv-python

  • OS: pip install os-sys

import cv2
import os

初始化:下一步涉及创建一个 VideoCapture 对象,该对象从系统的网络摄像头实时捕获视频。这是原始文档的链接:https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html

我们还需要三个变量:

  • flag_collecting:这是一个布尔变量,用作暂停/恢复按钮。

  • images_collected:这是一个整数变量,用于指示系统中收集和保存的图像数量。

  • images_required:这是一个整数变量,用于指示我们打算收集的图像数量。

然后,我们必须使用 OS 库中的mkdir(make-directory 的缩写)命令创建一个文件夹/目录(在本例中为 testing_demo )。

cap = cv2.VideoCapture(0)

flag_collecting = False
images_collected = 0
images_required = 50

directory = 'testing_demo'
os.mkdir(directory)

代码的关键:如果这是你第一次使用 OpenCV,建议你阅读此文档以了解代码:https://docs.opencv.org/4.x/dd/d43/tutorial_py_video_display.html

将逐行解释对标准代码的所有修改,以确保它更容易理解。

第 3 行:使用*flip()*命令沿 y 轴翻转帧,以确保视频以正确的方式显示。

第 5 行:while 循环将持续运行,直到收集的图像等于所需的图像。

第 8 行:使用 cv2.rectangle 命令画一个黑色方块。

第 11-14 行:提取黑色方块内的切片帧或屏幕的一部分。然后我会将这些提取的帧保存在上面创建的目录中。这将产生尺寸为 240x240 像素的图像。

OpenCV 中坐标系的原点位于左上角。(80,320) 是从原点开始的 y 坐标,它随着向下移动而增加。(380, 620) 是从原点开始的 x 坐标,它随着向右移动而增加。所以 (380, 80) 和 (620, 320) 对应黑色方块的左上角和右下角坐标。

第 16-18 行:显示在给定坐标处收集的图像数量。

第 21–22 行:键盘字符“s”(用于开始/停止)用于暂停或恢复图像收集。它本质上是一个切换按钮。

第 23 行:键盘字符 'q'(用于退出)用于关闭窗口

while True:
    ret, frame = cap.read()
    frame = cv2.flip(frame, 1)
    
    if images_collected == images_required:
        break

    cv2.rectangle(frame, (380,80),(620,320), (0, 0, 0), 3)

    if flag_collecting == True:
        sliced_frame = frame[80:320,380:620]
        save_path = os.path.join(directory, '{}.jpg'.format(images_collected + 1))
        cv2.imwrite(save_path, sliced_frame)
        images_collected += 1

    cv2.putText(frame, "Saved Images: {}".format(images_collected), (400, 50),
                cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 0), 2)
    cv2.imshow("Data Collection", frame)
    
    k = cv2.waitKey(10)
    if k == ord('s'):
        flag_collecting = not flag_collecting
    if k == ord('q'):
        break

print(images_collected, "images saved to directory")
cap.release()
cv2.destroyAllWindows()

应用:最初使用这种技术收集手部符号的图像来创建图像数据集(数据集可以在 Kaggle 上获得:https://www.kaggle.com/datasets/abhinowww/hand-cricket-symbols。你可以用任何东西创建图像数据集。发挥创意!

实施:已经添加了这个代码的一些图像。建议你在身后有一面空白墙壁来收集数据,以确保框架中没有外部噪音。

下图是在运行代码之后,在按下键盘上的字符“s”之前拍摄的,这将启动图像收集过程。

40bad2e931d4f3cdd8340ad6f0821873.png

图像收集前的初始状态

现在这张图片是在运行代码并按键“s”之后拍摄的。如你所见,收集的图像数量显示在黑色方块上方。这个黑色方块的大小可以根据用户的意愿更改为任何形状或大小。

db92b93c596ada784f05323ca23adbb9.png

图像收集过程中的中间状态

这是图像收集的结果。

61b48f496e7dff6e270528497a43536b.png

收集的样本图像

这是遇到过的收集和格式化图像数据的最简单方法之一!

 
 

好消息!

小白学视觉知识星球

开始面向外开放啦👇👇👇

 
 

4f0309856af3f91faf8d81049e6f10fd.jpeg

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值