本文将介绍如何利用 Google 开源的 MediaPipe 库,在 Python 中实现简单的实时脸部检测功能。通过本文,读者可以快速掌握 MediaPipe 的基本使用方法,并应用于人脸识别等领域。
一、简单介绍
随着人工智能技术的不断发展,人脸识别技术在日常生活中得到了广泛应用,如安防监控、人脸支付等。MediaPipe 是 Google 开源的一款跨平台机器学习解决方案库,提供了多种感知增强应用的功能,其中包括脸部检测。本文将带领大家使用 MediaPipe 实现实时脸部检测。
二、环境准备
在开始编写代码之前,我们需要安装以下依赖库:
- MediaPipe:用于实现脸部检测功能。
- OpenCV:用于捕获和处理视频流。
安装命令如下:
pip install mediapipe opencv-python
三、代码实现
以下是使用 MediaPipe 进行脸部检测的完整代码:
import cv2
import mediapipe as mp
# 初始化MediaPipe人脸检测模型
mp_face_detection = mp.solutions.face_detection
face_detection = mp_face_detection.FaceDetection(model_selection=0, min_detection_confidence=0.5)
# 初始化OpenCV视频捕获
cap = cv2.VideoCapture(0)
while cap.isOpened():
success, image = cap.read()
if not success:
continue
# 转换为RGB图片,因为MediaPipe需要RGB格式
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
# 复制图片,用于绘制结果
image.flags.writeable = False
results = face_detection.process(image)
# 将图片转换回BGR格式,以便OpenCV可以显示
image.flags.writeable = True
image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
# 如果检测到人脸,绘制人脸边界框
if results.detections:
for detection in results.detections:
# 绘制人脸边界框
bbox = detection.location_data.relative_bounding_box
h, w, c = image.shape
x = int(bbox.xmin * w)
y = int(bbox.ymin * h)
w = int(bbox.width * w)
h = int(bbox.height * h)
cv2.rectangle(image, (x, y), (x+w, y+h), (0, 255, 0), 2)
# 显示结果
cv2.imshow('Face Detection', image)
# 按 'q' 退出
if cv2.waitKey(5) & 0xFF == ord('q'):
break
# 释放视频捕获对象和销毁所有窗口
cap.release()
cv2.destroyAllWindows()
四、代码解析
1. 初始化 MediaPipe 脸部检测模型
mp_face_detection = mp.solutions.face_detection
face_detection = mp_face_detection.FaceDetection(model_selection=0, min_detection_confidence=0.5)
这里我们选择了默认的模型,并设置最小检测置信度为 0.5。
2. 初始化 OpenCV 视频捕获
cap = cv2.VideoCapture(0)
VideoCapture(0)
表示打开默认的摄像头。
3. 循环读取视频帧,进行脸部检测
while cap.isOpened():
# 省略了中间的代码
4. 绘制脸部边界框
if results.detections:
for detection in results.detections:
# 省略了绘制边界框的代码
五、运行结果
运行上述代码,程序将打开摄像头,并在检测到的人脸周围绘制绿色的矩形框。按下 ‘q’ 键可退出程序。
六、总结
本文介绍了如何使用 MediaPipe 实现实时脸部检测功能。通过简单的几行代码,我们就能实现人脸识别的基础应用。希望本文对您有所帮助,如有疑问,请随时在评论区留言。
PS:企图adb调用外部摄像头失败,等我再试试。