python识别_Python手势识别与控制

Python手势识别与控制

概述

本文中的手势识别与控制功能主要采用 OpenCV 库实现, OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库, 可以运行在Linux, Windows, Android和Mac-OS操作系统上. 它轻量级而且高效---由一系列 C 函数和少量 C++ 类构成, 同时提供了Python, Ruby, MATLAB等语言的接口, 实现了图像处理和计算机视觉方面的很多通用算法.

本文主要使用了OpenCV的视频采集, 图像色域转换, 颜色通道分割, 高斯滤波, OSTU自动阈值, 凸点检测, 边缘检测, 余弦定理计算手势等功能.

准备工作

安装 Python-OpenCV 库

pip install opencv-python -i https://mirrors.ustc.edu.cn/pypi/web/simple

利用 -i 为pip指令镜像源, 这里使用电子科技大学的源, 速度比官方源更快.

安装 Numpy 科学计算库

pip install numpy -i https://mirrors.ustc.edu.cn/pypi/web/simple

安装 PyAutogui 库

pip install pyautogui -i https://mirrors.ustc.edu.cn/pypi/web/simple

图像的基本操作

import numpy as np

import cv2

imname = "6358772.jpg"

# 读入图像

'''

使用函数 cv2.imread() 读入图像。这幅图像应该在此程序的工作路径,或者给函数提供完整路径.

警告:就算图像的路径是错的,OpenCV 也不会提醒你的,但是当你使用命令print(img)时得到的结果是None。

'''

img = cv2.imread(imname, cv2.IMREAD_COLOR)

'''

imread函数的第一个参数是要打开的图像的名称(带路径)

第二个参数是告诉函数应该如何读取这幅图片. 其中

cv2.IMREAD_COLOR 表示读入一副彩色图像, alpha 通道被忽略, 默认值

cv2.IMREAD_ANYCOLOR 表示读入一副彩色图像

cv2.IMREAD_GRAYSCALE 表示读入一副灰度图像

cv2.IMREAD_UNCHANGED 表示读入一幅图像,并且包括图像的 alpha 通道

'''

# 显示图像

'''

使用函数 cv2.imshow() 显示图像。窗口会自动调整为图像大小。第一个参数是窗口的名字,

其次才是我们的图像。你可以创建多个窗口,只要你喜欢,但是必须给他们不同的名字.

'''

cv2.imshow("image", img) # "image" 参数为图像显示窗口的标题, img是待显示的图像数据

cv2.waitKey(0) #等待键盘输入,参数表示等待时间,单位毫秒.0表示无限期等待

cv2.destroyAllWindows() # 销毁所有cv创建的窗口

# 也可以销毁指定窗口:

#cv2.destroyWindow("image") # 删除窗口标题为"image"的窗口

# 保存图像

'''

使用函数 cv2.imwrite() 来保存一个图像。首先需要一个文件名,之后才是你要保存的图像。

保存的图片的格式由后缀名决定.

'''

#cv2.imwrite(imname + "01.png", img)

cv2.imwrite(imname + 

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是关于Python实现手势识别的讲解。 手势识别是计算机视觉领域的一个重要应用,可以应用于很多场景,比如手势控制智能家居、手势控制游戏等。本文介绍一种基于OpenCV和Python实现的手势识别框架。 首先,需要安装OpenCV库。可以通过pip install opencv-python安装。 接下来,需要准备一些训练数据。可以使用手势识别数据集,也可以自己录制一些手势视频作为训练数据。这里以自己录制的视频为例。 步骤如下: 1.读取视频帧 使用OpenCV读取视频帧,可以使用cv2.VideoCapture()函数。代码如下: ``` python import cv2 cap = cv2.VideoCapture(0) while True: ret, frame = cap.read() cv2.imshow('frame', frame) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() ``` 这里使用的是电脑自带的摄像头,如果使用外接摄像头,则需要将0改为1或者2等,表示摄像头的编号。 2.手势检测 对于每一帧图像,需要进行手势检测,可以使用肤色检测的方法。代码如下: ``` python import cv2 import numpy as np cap = cv2.VideoCapture(0) while True: ret, frame = cap.read() frame = cv2.flip(frame, 1) # 翻转图像 hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) # 转换颜色空间 lower_skin = np.array([0, 20, 70], dtype=np.uint8) upper_skin = np.array([20, 255, 255], dtype=np.uint8) mask = cv2.inRange(hsv, lower_skin, upper_skin) # 掩膜 res = cv2.bitwise_and(frame, frame, mask=mask) # 图像与运算 cv2.imshow('frame', frame) cv2.imshow('mask', mask) cv2.imshow('res', res) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() ``` 这里使用的是HSV颜色空间,对肤色进行了阈值处理,得到掩膜,然后进行与运算,得到手部区域。 3.手势识别 对于手部区域,可以使用轮廓检测的方法,得到手部轮廓。代码如下: ``` python import cv2 import numpy as np cap = cv2.VideoCapture(0) while True: ret, frame = cap.read() frame = cv2.flip(frame, 1) # 翻转图像 hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) # 转换颜色空间 lower_skin = np.array([0, 20, 70], dtype=np.uint8) upper_skin = np.array([20, 255, 255], dtype=np.uint8) mask = cv2.inRange(hsv, lower_skin, upper_skin) # 掩膜 res = cv2.bitwise_and(frame, frame, mask=mask) # 图像与运算 gray = cv2.cvtColor(res, cv2.COLOR_BGR2GRAY) # 灰度图像 ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU) # 二值化 _, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) cnt = max(contours, key=cv2.contourArea) # 手部轮廓 cv2.drawContours(frame, [cnt], 0, (0, 255, 0), 2) # 绘制轮廓 cv2.imshow('frame', frame) cv2.imshow('mask', mask) cv2.imshow('res', res) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() ``` 这里使用的是cv2.findContours()函数进行轮廓检测,然后找到最大轮廓,绘制出手部轮廓。 4.手势分类 对于手部轮廓,可以使用机器学习算法进行分类,得到手势的类别。这里使用KNN算法进行分类。代码如下: ``` python import cv2 import numpy as np from sklearn.neighbors import KNeighborsClassifier cap = cv2.VideoCapture(0) k = 5 # KNN算法中的k值 hand_hist = None # 手部直方图 # 训练KNN分类器 def train_knn(): global hand_hist # 读取训练数据 with np.load('hand_data.npz') as data: train = data['train'] train_labels = data['train_labels'] # 计算手部直方图 hsv = cv2.cvtColor(train, cv2.COLOR_BGR2HSV) roi = np.zeros([1, 50, 50, 3], dtype=hsv.dtype) roi[0] = hsv[0:50, 0:50] hsv_hist = cv2.calcHist(roi, [0, 1], None, [180, 256], [0, 180, 0, 256]) cv2.normalize(hsv_hist, hsv_hist, 0, 255, cv2.NORM_MINMAX) hand_hist = hsv_hist.reshape([1, 180 * 256]) # 训练KNN分类器 knn = KNeighborsClassifier(n_neighbors=k) knn.fit(hand_hist, train_labels) return knn # 手势分类 def classify(frame, knn): global hand_hist hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) dst = cv2.calcBackProject([hsv], [0, 1], hand_hist, [0, 180, 0, 256], 1) _, thresh = cv2.threshold(dst, 0, 255, cv2.THRESH_BINARY) thresh = cv2.merge((thresh, thresh, thresh)) res = cv2.bitwise_and(frame, thresh) gray = cv2.cvtColor(res, cv2.COLOR_BGR2GRAY) _, contours, hierarchy = cv2.findContours(gray, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) if len(contours) > 0: cnt = max(contours, key=cv2.contourArea) if cv2.contourArea(cnt) > 1000: x, y, w, h = cv2.boundingRect(cnt) cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2) roi = gray[y:y + h, x:x + w] roi = cv2.resize(roi, (50, 50), interpolation=cv2.INTER_LINEAR) roi = roi.reshape([1, 50 * 50]) result = knn.predict(roi) cv2.putText(frame, chr(result + 65), (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2) return frame # 训练KNN分类器 knn = train_knn() while True: ret, frame = cap.read() frame = cv2.flip(frame, 1) # 翻转图像 if hand_hist is None: cv2.putText(frame, 'Press Space to calibrate', (50, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2) else: frame = classify(frame, knn) cv2.imshow('frame', frame) if cv2.waitKey(1) & 0xFF == ord('q'): break elif cv2.waitKey(1) & 0xFF == ord(' '): hand_hist = None cap.release() cv2.destroyAllWindows() ``` 这里使用的是KNN算法进行分类,需要先训练KNN分类器。训练数据可以使用手势识别数据集,也可以使用自己录制的手势视频。这里使用的是手势识别数据集。训练数据需要保存到文件中,可以使用numpy.savez()函数进行保存,使用numpy.load()函数进行读取。 对于每一帧图像,需要先计算手部直方图,然后使用cv2.calcBackProject()函数进行反向投影,得到手部区域。对手部区域进行二值化、轮廓检测、矩形框选、手势分类等操作,最终得到手势类别。 以上就是基于OpenCV和Python实现手势识别的框架和实例讲解。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值