基于大疆EP和Opencv完成人脸跟随项目

基于大疆EP和Opencv完成人脸跟随项目

知识储备

我们需要了解三方面的知识,第一方面是python的语法结构,也是最基础的,第二方面是opencv的基础知识,第三方面就是大疆的SDK啦,只有我们具备了这些知识,就可以简单完成人脸识别项目啦。
Opencv学习网站https://www.bilibili.com/video/BV1oJ411D71z
大疆EP的开发者文档网址https://robomaster-dev.readthedocs.io/zh_CN/latest/
至于python的语法结构,大家可以到MOOC,哔哩哔哩等地方找资源哦,适合自己的才是最好的哦

实现步骤

连接EP——获取EP图像——处理EP图像——获得人脸坐标——控制云台运动
下面我们就开始吧。

环境安装

安装python请参考https://blog.csdn.net/qq_43603247/article/details/105520688
在运行程序的时候我们需要在python安装robomaster库和opencv库
安装robomaster库 在电脑的cmd输入pip install robomaster
在使用SDK时候需要安装VC,不然会出现下面的错误
在这里插入图片描述
需要安装VC,下载地址https://github.com/dji-sdk/robomaster-sdk
安装opencv : pip install opencv-python

具体步骤

1.连接EP,在大疆的开发者文档里有
WiFi 直连

import robomaster
from robomaster import robot


if __name__ == '__main__':
    # 如果本地IP 自动获取不正确,手动指定本地IP地址
    # robomaster.config.LOCAL_IP_STR = "192.168.2.20"
    ep_robot = robot.Robot()

    # 指定连接方式为AP 直连模式
    ep_robot.initialize(conn_type='ap')

    version = ep_robot.get_version()
    print("Robot version: {0}".format(version))
    ep_robot.close()

其他连接方法请参考大疆的SDK开发文档
2.获取EP的视频流-该项目显示200帧的视频流

// An highlighted block
import time
import cv2
import robomaster
from robomaster import robot


if __name__ == '__main__':
    ep_robot = robot.Robot()
    ep_robot.initialize(conn_type="sta")

    ep_camera = ep_robot.camera

    # 显示200帧图传
    ep_camera.start_video_stream(display=False)
    for i in range(0, 200):
        img = ep_camera.read_cv2_image()
        cv2.imshow("Robot", img)
        cv2.waitKey(1)
    cv2.destroyAllWindows()
    ep_camera.stop_video_stream()

    ep_robot.close()

3.处理EP图像并获取人脸坐标

def shibei():
    global RLzhongxi_x,RLzhongxi_y #定义两个全局变量,用来储存人脸的坐标
    cv2.namedWindow("img", 1)  #新建一个显示窗口
    cv2.resizeWindow("img", 800, 400)  #图像框的大小
    ret,img=cap.read()#vc.read()读取图片的第一帧 返回两个值,第一个值是true或者false,判断有没有读取到,第二个值是当前的一帧图像
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#将读取到的值转化为灰度图
    faces = face_cascade.detectMultiScale(gray,1.1,5)#检测出图片中所有的人脸,并将人脸的各个坐标保持到faces里
    if len(faces)>0:#判断是否检测到人脸
        for faceRect in faces:   #依次读取faces的值
            x,y,w,h = faceRect
            cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),3)#绘制人脸框
            roi_gray = gray[y:y+h//2,x:x+w]
            roi_color = img[y:y+h//2,x:x+w]
            RLzhongxi_x = x+w/2 #获取人脸中心坐标
            RLzhongxi_y = y+h/2
            eyes = eye_cascade.detectMultiScale(roi_gray,1.1,1,cv2.CASCADE_SCALE_IMAGE,(2,2))#检测眼睛
            for (ex,ey,ew,eh) in eyes:
                cv2.rectangle(roi_color,(ex,ey),(ex+ew,ey+eh),(0,255,0),2)#绘制眼睛框
    cv2.imshow("img",img)#显示图像
    
    return RLzhongxi_x,RLzhongxi_y#返回人脸中心坐标

4.控制云台运动
云台有两个轴,分别是航向轴和俯仰轴,航向轴是围绕的y轴转动,俯仰轴是围绕x轴转动,我们要做的是控制两个轴转到人脸的中心。

// An highlighted block
def Error():
    RLzhongxi_x_1=centre[0]#将上面的值传到这里
    RLzhongxi_y_1=centre[1]
    TXzhongxi_x=400 #整个图像的中心坐标
    TXzhongxi_y=200
    error_x=TXzhongxi_x-RLzhongxi_x_1 #偏航轴的的误差
    error_y=TXzhongxi_y-RLzhongxi_y_1#俯仰轴的误差
    if abs(error_x) < 10:#判断误差是否小于10,如果小于默认为到达人脸中心
        yaw0_speed = 0
    else:
        yaw0_speed = KP*error_x#输出偏航轴的速度
    if abs(error_y) < 10:
        pitch0_speed = 0
    else:
        pitch0_speed = -KP*error_y#输出俯仰轴的速度
    print("yaw的速度:",yaw0_speed)
    print("Pitch的速度:",pitch0_speed)
    ep_gimbal.drive_speed(pitch_speed='{pitch}', yaw_speed='{yaw}'.format(pitch=pitch0_speed,yaw=yaw0_speed))#控制云台

总体代码

#导入需要用到的库
import cv2
import numpy as np
import wave
import re
import socket
import sys
import numpy as np 

  
#创建新的对象
ep_robot = robot.Robot()

# 指定连接方式为AP 直连模式,初始化
ep_robot.initialize(conn_type='ap')    

#开始获取视频流,但是不播放
ep_camera.start_video_stream(display=False)

#设置模式为自由模式
ep_robot.set_robot_mode(mode=robot.FREE)





#获取官方提供的特征库,根据自己电脑设置路径
face_cascade = cv2.CascadeClassifier("D://python38//Lib//site-packages//cv2//data//haarcascade_frontalface_default.xml")  
eye_cascade = cv2.CascadeClassifier("D://python38//Lib//site-packages//cv2//data//haarcascade_eye.xml")
KP = 0.15#比例系数,让云台转的慢一点

    
    

 
def shibei():
    global RLzhongxi_x,RLzhongxi_y #定义两个全局变量,用来储存人脸的坐标
    cv2.namedWindow("img", 1)  #新建一个显示窗口
    cv2.resizeWindow("img", 800, 400)  #图像框的大小    
    img = ep_camera.read_cv2_image()#获取视频流的一帧图像
    gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#将读取到的值转化为灰度图
    faces = face_cascade.detectMultiScale(gray,1.1,5)#检测出图片中所有的人脸,并将人脸的各个坐标保持到faces里
    if len(faces)>0:#判断是否检测到人脸
        for faceRect in faces:   #依次读取faces的值
            x,y,w,h = faceRect
            cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),3)#绘制人脸框
            roi_gray = gray[y:y+h//2,x:x+w]
            roi_color = img[y:y+h//2,x:x+w]
            RLzhongxi_x = x+w/2 #获取人脸中心坐标
            RLzhongxi_y = y+h/2
            eyes = eye_cascade.detectMultiScale(roi_gray,1.1,1,cv2.CASCADE_SCALE_IMAGE,(2,2))#检测眼睛
            for (ex,ey,ew,eh) in eyes:
                cv2.rectangle(roi_color,(ex,ey),(ex+ew,ey+eh),(0,255,0),2)#绘制眼睛框
    cv2.imshow("img",img)#显示图像
    cv2.waitKey(2)#每两帧的间隔时间
    
    return RLzhongxi_x,RLzhongxi_y#返回人脸中心坐标
 
def Error():
    RLzhongxi_x_1=centre[0]#将上面的值传到这里
    RLzhongxi_y_1=centre[1]
    TXzhongxi_x=400 #整个图像的中心坐标
    TXzhongxi_y=200
    error_x=TXzhongxi_x-RLzhongxi_x_1 #偏航轴的的误差
    error_y=TXzhongxi_y-RLzhongxi_y_1#俯仰轴的误差
    if abs(error_x) < 10:#判断误差是否小于10,如果小于默认为到达人脸中心
        yaw0_speed = 0
    else:
        yaw0_speed = KP*error_x#输出偏航轴的速度
    if abs(error_y) < 10:
        pitch0_speed = 0
    else:
        pitch0_speed = -KP*error_y#输出俯仰轴的速度
    print("yaw的速度:",yaw0_speed)
    print("Pitch的速度:",pitch0_speed)
    ep_gimbal.drive_speed(pitch_speed='{pitch}', yaw_speed='{yaw}'.format(pitch=pitch0_speed,yaw=yaw0_speed))#控制云台



while True:
    
    shibei()
    centre = shibei()
    Error()

    

    

    
    

因为EP借出去了,没有测试过新版的SDK,以前就旧的SDK是可以用的,如果有问题,希望大家指正,谢谢,微信:13580449720

  • 2
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
基于Qt、C++和OpenCV人脸识别项目可具有以下的实现方法和功能。 首先,我们可以使用Qt来设计人机界面,以实现用户与软件的交互。Qt提供了丰富的图形界面设计工具和库,可以轻松创建用户友好的界面。用户可以通过界面选择或上传图片进行人脸识别,还可以调整一些识别参数。 其次,我们将使用C++作为开发语言,结合Qt和OpenCV两个库进行编程。C++是一种效率和灵活性都较高的编程语言,适合开发较复杂的应用程序。通过使用C++,我们可以利用Qt框架提供的功能来实现用户界面,同时结合OpenCV库来实现人脸识别的算法。 最重要的是,我们使用OpenCV库进行人脸识别。OpenCV是一个开源的计算机视觉库,其中包含了丰富的图像处理和分析算法。通过OpenCV人脸识别算法,我们可以对输入的人脸图像进行预处理、特征提取和匹配,以确定人脸识别的结果。 在项目中,我们可以使用基于OpenCV人脸检测算法来检测图像中的人脸区域,然后基于这些检测到的人脸区域进行人脸特征提取和匹配。我们可以使用OpenCV提供的特征描述子算法,如局部二值模式直方图(Local Binary Patterns Histograms, LBPH)或离散小波变换(Discrete Wavelet Transform, DWT),来提取人脸的特征向量。然后,我们可以使用分类器,如支持向量机(Support Vector Machine, SVM)或人工神经网络(Artificial Neural Networks, ANN),来对提取的特征向量进行训练和分类,以实现人脸识别的功能。 通过使用Qt、C++和OpenCV,我们可以开发一个功能完善的人脸识别项目,具有用户友好界面和准确的人脸识别算法,可以广泛应用于人脸识别的场景,如安全监控、人脸解锁等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值