效果展示
逻辑设计
- 通过循环语句一直读取摄像头的每一帧。
- 把这一帧图像转换成tensor。
- 送入模型。
- 模型返回人脸框的四个坐标,与True或False(是否佩戴口罩的结果)。
- 通过返回结果在视频上可视化展示。
安装依赖
!pip install paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple
PaddleHub 介绍
PaddleHub 是基于 PaddlePaddle 开发的预训练模型管理工具,可以借助预训练模型更便捷地开展迁移学习工作,旨在让 PaddlePaddle 生态下的开发者更便捷体验到大规模预训练模型的价值。
PaddleHub 目前的预训练模型覆盖了图像分类、目标检测、词法分析、Transformer、情感分析五大类别。未来会持续开放更多类型的深度学习模型,如语言模型、视频分类、图像生成等预训练模型。
模型简述
PaddleHub口罩检测提供了两种预训练模型,pyramidbox_lite_mobile_mask和pyramidbox_lite_server_mask。二者均是基于2018年百度发表于计算机视觉顶级会议ECCV 2018的论文PyramidBox而研发的轻量级模型,模型基于主干网络FaceBoxes,对于光照、口罩遮挡、表情变化、尺度变化等常见问题具有很强的鲁棒性。
不同点在于:pyramidbox_lite_mobile_mask是针对于移动端优化过的模型,适合部署于移动端或者边缘检测等算力受限的设备上。
代码实现
导入依赖
import cv2
import paddlehub as hub
导入预训练
module = hub.Module(name="pyramidbox_lite_mobile_mask")
读取摄像头
module = hub.Module(name="pyramidbox_lite_mobile_mask")
定义字体
font = cv2.cv2.FONT_HERSHEY_SIMPLEX
读取视频流并预测
while True:
ret, frame = video_capture.read()
results = module.face_detection(images=[frame], confs_threshold=0.5,shrink = 0.1)
try:
print(results)
for i in results[0]['data']:
if 'NO' not in i['label']:
cv2.rectangle(frame, (i['left'], i['top']), (i['right'], i['bottom']), (0, 255, 0), 2)
cv2.putText(frame, i['label']+str(round(i['confidence'],2)), (i['left'], i['top']), font, 1, (0, 255, 0), 1)
else:
cv2.rectangle(frame, (i['left'], i['top']), (i['right'], i['bottom']), (0, 0, 255), 2)
cv2.putText(frame, i['label']+str(round(i['confidence'],2)), (i['left'], i['top']), font, 1, (0, 0, 255), 1)
except:
pass
if cv2.waitKey(25) & 0xFF == ord('q'):
break
cv2.imshow('Video', frame)