OpenCV+python实现摄像头简单手势识别--进度条控制亮度

前言

例如:随着人工智能的不断发展,计算机视觉这门技术也越来越重要,很多人都开启了学习计算机视觉,本文在Opencv基础上实现了摄像头简单手势识别–进度条控制亮度的基础内容,并没有使用深度学习技术,因此准确率并不高。


一、整体框架

∙ \bullet 第一步: 开启摄像头,检测每帧图片;

∙ \bullet 第二步: 设置回调函数,操纵滑动条来调整亮度;

∙ \bullet 第三步: 肤色检测,基于HSV颜色空间H,S,V范围筛选法。在HSV中 7<H<20,28<S<256,50<V<256;

∙ \bullet 第四步: 进行高斯滤波;

∙ \bullet 第五步: 边缘轮廓检测;

∙ \bullet 第六步: 求出手势的凹凸点;

∙ \bullet 第七步: 利用凹凸点个数判断当前手势。例如:0个凹凸点就是拳头,4个凹点就是布。

二、使用步骤;

1.引入库;

import cv2
import numpy as np
import math

2.第一步:打开摄像头;

代码如下(示例):

cap = cv2.VideoCapture(0)
while (cap.isOpened()):  
    ret, frame = cap.read()  # 读取摄像头每帧图片
    frame = cv2.flip(frame, 1)  #镜像调整,将图像左右调换回来正常显示

3.第二步:设置回调函数;

def callback(object):  #注意这里createTrackbar会向其传入参数即滑动条地址(几乎用不到),所以必须写一个参数
    pass
cv2.createTrackbar("change", "frame", 100, 255, callback)

4.第三步:肤色检测;

# 基于hsv的肤色检测,通过HSV颜色空间来筛选所需要的像素
hsv = cv2.cvtColor(roi, cv2.COLOR_BGR2HSV)
lower_skin = np.array([0, 28, 70], dtype=np.uint8)
upper_skin = np.array([20, 255, 255], dtype=np.uint8)

5.第四步:进行高斯滤波;

# 进行高斯滤波,降低噪声的影响
mask = cv2.inRange(hsv, lower_skin, upper_skin)
mask = cv2.dilate(mask, kernel, iterations=4)
mask = cv2.GaussianBlur(mask, (5, 5), 100)

6.第五步:边缘轮廓检测;

# 找出轮廓,确定手势范围
contours, h = cv2.findContours(
    mask, cv2.RETR_TREE,
    cv2.CHAIN_APPROX_SIMPLE)  #opencv中提供findContours()函数来寻找图像中物体的轮廓
cnt = max(contours, key=lambda x: cv2.contourArea(x))
epsilon = 0.0005 * cv2.arcLength(cnt, True)
approx = cv2.approxPolyDP(cnt, epsilon, True)
hull = cv2.convexHull(cnt)
areahull = cv2.contourArea(hull)
areacnt = cv2.contourArea(cnt)
arearatio = ((areahull - areacnt) / areacnt) * 100

7.第六步:求出手势的凹凸点;

# 求出凹凸点
hull = cv2.convexHull(approx, returnPoints=False)  #convexHull能很方便的用于求多边形凸包
defects = cv2.convexityDefects(approx, hull)  #使用convexityDefects计算轮廓凸缺陷

8.第七步: 利用凹凸点个数判断当前手势;

# 定义凹凸点个数初始值为0
l = 0
for i in range(defects.shape[0]):
    s, e, f, d, = defects[i, 0]
    start = tuple(approx[s][0])
    end = tuple(approx[e][0])
    far = tuple(approx[f][0])
    pt = (100, 100)
    a = math.sqrt((end[0] - start[0])**2 + (end[1] - start[1])**2)
    b = math.sqrt((far[0] - start[0])**2 + (far[1] - start[1])**2)
    c = math.sqrt((end[0] - far[0])**2 + (end[1] - far[1])**2)
    s = (a + b + c) / 2
    ar = math.sqrt(s * (s - a) * (s - b) * (s - c))
    # 手指间角度求取
    angle = math.acos((b**2 + c**2 - a**2) / (2 * b * c)) * 57
    if angle <= 90 and d > 20:
        l += 1
        cv2.circle(roi, far, 3, [255, 0, 0], -1)
    cv2.line(roi, start, end, [0, 255, 0], 2)  # 画出包络线
l += 1
font = cv2.FONT_HERSHEY_SIMPLEX

成果展示

可通过滑动条来调整亮度,提高识别率。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
由于肤色检测的时候是用色调来提取特征,因此会被黄色调的影响,因此准确率并不算高,只能实现基本的功能,要想准确率高还得上深度学习算法。

完整代码

# -*- coding: utf-8 -*-
"""
Created on Thu Apr  7 18:42:02 2022

@author: He Zekai
"""
import cv2
import numpy as np
import math

def callback(object):  #注意这里createTrackbar会向其传入参数即滑动条地址(几乎用不到),所以必须写一个参数
    pass

cap = cv2.VideoCapture(0)

cv2.namedWindow('frame')
cv2.resizeWindow('frame',600,800)
cv2.createTrackbar("change", "frame", 100, 255, callback)

while(cap.isOpened()):        
    ret,image = cap.read() # 读取摄像头每帧图片
    
    image = cv2.flip(image,1)

    cv2.rectangle(image,(100,100),(300,300),(0,0,255),0) # 用红线画出手势识别框
    
    #滑动条控制颜色    
    value = cv2.getTrackbarPos('change', 'frame')
    image_dst = np.uint8(image/100*value)


    roi = image_dst[100:300,100:300]# 选取图片中固定位置作为手势输入
    kernel = np.ones((2,2),np.uint8)

    # 进行高斯滤波
    lower_skin = np.array([0,28,70],dtype=np.uint8)
    upper_skin = np.array([20, 255, 255],dtype=np.uint8)
    
    mask = cv2.inRange(roi,lower_skin,upper_skin)
    mask = cv2.dilate(mask,kernel,iterations=4)
    mask = cv2.GaussianBlur(mask,(3,3),100)
    
    # 基于hsv的肤色检测
    hsv = cv2.cvtColor(roi,cv2.COLOR_BGR2HSV)

    # 进行高斯滤波
    mask = cv2.inRange(hsv,lower_skin,upper_skin)
    mask = cv2.dilate(mask,kernel,iterations=4)
    mask = cv2.GaussianBlur(mask,(5,5),100)

    # 找出轮廓
    contours,h = cv2.findContours(mask,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
    cnt = max(contours,default=0,key=lambda x:cv2.contourArea(x))
    epsilon = 0.0005*cv2.arcLength(cnt,True)
    approx = cv2.approxPolyDP(cnt,0.05,True)
    hull = cv2.convexHull(cnt)
    areahull = cv2.contourArea(hull)
    areacnt = cv2.contourArea(cnt)
    arearatio = ((areahull-areacnt)/areacnt)*100

    # 求出凹凸点
    hull = cv2.convexHull(approx,returnPoints=False)
    defects = cv2.convexityDefects(approx,hull)

    # 定义凹凸点个数初始值为0
    l=0
    try:
        for i in range(defects.shape[0]):
            s,e,f,d, = defects[i,0]
            start = tuple(approx[s][0])
            end = tuple(approx[e][0])
            far = tuple(approx[f][0])
            pt = (100,100)
        
            a = math.sqrt((end[0]-start[0])**2+(end[1]-start[1])**2)
            b = math.sqrt((far[0] - start[0]) ** 2 + (far[1] - start[1]) ** 2)
            c = math.sqrt((end[0]-far[0])**2+(end[1]-far[1])**2)
            s = (a+b+c)/2
            ar = math.sqrt(s*(s-a)*(s-b)*(s-c))
        
        	# 手指间角度求取
            angle = math.acos((b**2 + c**2 -a**2)/(2*b*c))*57
        
            if angle<=90 and d>20:
                l+=1
                cv2.circle(roi,far,3,[255,0,0],-1)
            cv2.line(roi,start,end,[0,255,0],2) # 画出包络线
        l+=1
        font = cv2.FONT_HERSHEY_SIMPLEX
        
        # 条件判断,知道手势后想实现的功能
        if l==1:
            if areacnt<2000:
                cv2.putText(image_dst,"Please put hand in the window",(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
            else:
                if arearatio<12:
                    cv2.putText(image_dst,'0',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
                elif arearatio<17.5:
                    cv2.putText(image_dst,"1",(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
                else:
                    cv2.putText(image_dst,'1',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
        elif l==2:
            cv2.putText(image_dst,'2',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
        elif l==3:
            if arearatio<27:
                cv2.putText(image_dst,'3',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
            else:
                cv2.putText(image_dst,'3',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
        elif l==4:
            cv2.putText(image_dst,'4',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
        elif l==5:
            cv2.putText(image_dst,'5',(0,50),font,2,(0,0,255),3,cv2.LINE_AA)
        # cv2.imshow('frame',frame)
        cv2.imshow('mask', mask)
        cv2.imshow('frame', image_dst)
        
        key = cv2.waitKey(25)& 0xFF
        if key == ord('q'):     # 键盘q键退出
            break
    except:
        pass

cv2.destroyAllWindows()
cap.release()

总结

例如:本次基于摄像头的简单手势识别实验,让我对以往的知识掌握更加深刻。虽然现在手势识别都是通过深度学习中的CNN等实现的,但仅使用opencv的传统方法来实现这个功能对我来说还挺新颖的,让我对opencv更加充满了兴趣。

  • 9
    点赞
  • 132
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
### 回答1: 首先,摄像头 sensor的选型需要根据具体应用场景来确定。不同的应用场景对摄像头的要求不同,例如,安防领域对摄像头的要求较高,需要摄像头具备高清、低光补偿等特性,而工业视觉领域对红外成像和深度识别等方面的性能要求更多。 其次,摄像头 sensor的分辨率是一个重要的选型指标。分辨率越高,能够捕捉到的细节越多,但也会带来画面噪点增多、帧率下降等问题。因此,在选择摄像头时需要根据具体应用场景的需求来确定分辨率,以达到最佳的画面质量和性能表现。 另外,选择摄像头 sensor的时候也需要考虑其色彩还原能力、动态范围等性能参数。颜色还原能力决定了图像色彩的真实度和还原度,而动态范围则决定了图像亮度范围的动态度,对于场景中存在的光照强度变化较大的情况来说,这两个参数尤为重要。 总之,选择摄像头 sensor需要结合应用场景的需求,综合考虑各种性能参数,以达到最佳的画面质量和系统性能。 ### 回答2: 在选择摄像头 sensor 时,需要从以下几个方面考虑: 1. 应用场景:不同的应用场景对摄像头的要求不同,比如需要高分辨率的拍摄、远距离的捕捉、低光环境下的拍摄等等,因此需要根据应用场景来选择合适的摄像头。 2. 分辨率:摄像头的分辨率影响图像质量,分辨率越高,图像越清晰。但是高分辨率的摄像头会消耗更多的系统资源和电力,需要根据实际应用需求来做出选择。 3. 光学质量:摄像头的光学质量包括镜头的质量以及镜头数量等因素,这些因素都会影响图像的质量和拍摄的可靠性。 4. 灵敏度:摄像头的灵敏度影响它在不同光照条件下的表现,对于低光条件下的应用,需要选择灵敏度较高的摄像头。 5. 接口类型:摄像头的接口类型包括 USB、HDMI、Ethernet 等,需要根据所选的处理器或开发板类型来选择合适的接口类型。 总之,在选型时需要综合考虑摄像头的特性、应用场景和系统资源等因素,以选择最适合实际应用需求的摄像头。 ### 回答3: 摄像头 sensor 的选型需要根据不同的应用场景来选择合适的规格。首先,需要考虑的因素是图像传感器的分辨率。分辨率越高,图像的细节越清晰,但是价格也越高。其次,需要考虑的是感光元件的大小。感光元件越大,则在低光环境下的表现越好,但是整个传感器也会变得更大,可能不适合一些小型摄像头的设计。再者,还需要考虑图像噪声和动态范围,这些因素影响着图像的质量和清晰度。 选择合适的摄像头 sensor 还需要考虑其它因素,例如帧速率、颜色深度和接口类型等。帧速率取决于拍摄的物体运动速度,越高则可以更清晰地捕获到快速运动物体的图片。颜色深度对颜色的还原质量和图像的真实感有影响,一般可选 8 或 12 位深度。接口类型有 USB、CSI、SPI、I2C 等多种类型,需要根据设备连接方式和传输速率来选取合适的接口。 另外,在使用摄像头 sensor 时,还需要考虑到功耗和工作温度等因素。在一些特殊环境下,需要选择耐高温或低功耗的产品。 综上所述,选择合适的摄像头 sensor 是依据应用场景和设计要求来进行的,需要充分考虑到各种因素,综合权衡选取最佳方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值