![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
MediaPipe
文章平均质量分 77
求则得之,舍则失之
这个作者很懒,什么都没留下…
展开
-
MediaPipe基础(9)手指计数
本文实现手指计数,可以实现0~5的计数。链接:https://pan.baidu.com/s/1YvbSx9uPpSG1UyXLmPtlHQ 提取码:123a# HandTrackingModule.pyimport cv2import mediapipe as mpimport timeclass handDetector(): def __init__(self, mode=False, maxHands=2, detectionCon=0.5, trackCon=0.5):原创 2021-09-29 14:20:40 · 918 阅读 · 0 评论 -
MediaPipe基础(8)手势控制音量
在之前的文章里面,已经实现了手的检测以及地标,本文中根据手势实现音量控制,需要下安装pycaw库:pip install pycaw。链接:https://pan.baidu.com/s/10qlxxTMRQwwDlo_3uogRtQ 提取码:123a手地标示意图代码展示首先封装手势跟踪模块# HandTrackingModule.py#!/usr/bin/python3# -*- encoding: utf-8 -*-import cv2import mediapipe as mp原创 2021-09-29 13:28:44 · 1604 阅读 · 0 评论 -
MediaPipe基础(7)Objectron
1.摘要MediaPipe Objectron 是一种用于日常物体的移动实时 3D 物体检测解决方案。它检测 2D 图像中的物体,并通过机器学习 (ML) 模型估计它们的姿势,该模型在 Objectron 数据集上训练。对象检测是一个被广泛研究的计算机视觉问题,但大部分研究都集中在二维对象预测上。虽然 2D 预测仅提供 2D 边界框,但通过将预测扩展到 3D,人们可以捕捉物体在世界中的大小、位置和方向,从而在机器人、自动驾驶汽车、图像检索和增强现实等领域得到广泛应用。尽管 2D 物体检测相对成熟并已在行原创 2021-09-29 12:38:44 · 2484 阅读 · 0 评论 -
MediaPipe基础(6)Selfie Segmentation(自拍分割)
1.摘要MediaPipe Selfie Segmentation对场景中突出的人进行了分割。它可以在智能手机和笔记本电脑上实时运行。预期的使用场景包括自拍效果和视频会议,即人们离相机很近(小于2米)。2.模型在这个解决方案中,我们提供了两种模型:一般模型和景观模型。两种模型都基于 MobileNetV3,并进行了修改以提高效率。通用模型在 256x256x3 (HWC) 张量上运行,并输出代表分割掩码的 256x256x1 张量。景观模型类似于通用模型,但在 144x256x3 (HWC) 张量上运原创 2021-09-29 10:28:39 · 3172 阅读 · 1 评论 -
MediaPipe基础(5)Pose(姿势)
1.摘要从视频中估计人体姿势在各种应用中起着至关重要的作用,例如量化体育锻炼、手语识别和全身手势控制。例如,它可以构成瑜伽、舞蹈和健身应用的基础。它还可以在增强现实中将数字内容和信息叠加在物理世界之上。MediaPipe Pose 是一种用于高保真身体姿势跟踪的 ML 解决方案,利用我们的 BlazePose 研究从 RGB 视频帧推断整个身体上的 33 个 3D 地标和背景分割掩码,该研究也为 ML Kit 姿势检测 API 提供支持。当前最先进的方法主要依赖于强大的桌面环境进行推理,而我们的方法在大原创 2021-09-29 09:46:24 · 18543 阅读 · 13 评论 -
MediaPipe基础(4)Hands(手)
1.摘要在各种技术领域和平台,感知手的形状和运动的能力是改善用户体验的重要组成部分。例如,它可以构成手语理解和手势控制的基础,还可以在增强现实中将数字内容和信息叠加在物理世界之上。虽然对人们来说很自然,但强大的实时手部感知绝对是一项具有挑战性的计算机视觉任务,因为手经常遮挡自己或彼此(例如手指/手掌遮挡和握手)并且缺乏高对比度模式。MediaPipe Hands 是一种高保真手和手指跟踪解决方案。它采用机器学习 (ML) 从单个帧中推断出手的 21 个 3D 地标。当前最先进的方法主要依赖于强大的桌面环原创 2021-09-28 16:34:52 · 15453 阅读 · 7 评论 -
MediaPipe基础(3)虹膜(Iris)
1.摘要包括计算摄影(闪光反射)和增强现实效果(虚拟化身)在内的广泛的现实世界应用依赖于准确跟踪眼睛内的虹膜。由于有限的计算资源、可变的光照条件以及遮挡物(例如头发或人眯眼)的存在,在移动设备上解决此问题是一项具有挑战性的任务。虹膜跟踪也可用于确定相机到用户的公制距离。这可以改进各种用例,从虚拟试戴合适尺寸的眼镜和帽子到根据观看者的距离采用字体大小的辅助功能。通常,使用复杂的专用硬件来计算公制距离,从而限制了可以应用该解决方案的设备范围。MediaPipe 虹膜是一种用于精确虹膜估计的 ML 解决方案,原创 2021-09-28 15:45:10 · 2725 阅读 · 0 评论 -
MediaPipe基础(2)人脸网格
1.摘要MediaPipe Face Mesh 是一种面部几何解决方案,即使在移动设备上也能实时估计 468 个 3D 面部标志。它采用机器学习 (ML) 来推断 3D 表面几何形状,只需要一个摄像头输入,无需专用深度传感器。该解决方案在整个管道中利用轻量级模型架构和 GPU 加速,提供对实时体验至关重要的实时性能。此外,该解决方案与人脸几何模块捆绑在一起,弥合了人脸地标估计和有用的实时增强现实 (AR) 应用程序之间的差距。它建立了一个可度量的3D空间,并使用面部地标屏幕位置来估计该空间内的面部几何形原创 2021-09-28 14:04:07 · 5950 阅读 · 1 评论 -
MediaPipe基础(1)人脸检测
在这个项目中,我们将学习如何检测人脸上的468个不同的标记。我们将使用谷歌提供的模型,该模型在CPU和移动设备上实时运行。原创 2021-09-28 12:58:03 · 5633 阅读 · 0 评论