推出 BlazePose：实现设备端实时人体姿态追踪

谷歌开发者

于 2020-09-14 17:31:00 发布

阅读量5.2k

点赞数 7

文章标签：网络人工智能深度学习计算机视觉机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/googledevs/article/details/108590889

版权

Google Research推出了BlazePose，一种新型人体姿态感知方法，可在单帧图像中推断33个2D关键点，适用于健身、舞蹈等应用。BlazePose模型在CPU上实现实时性能，GPU上甚至可达超实时性能，为移动设备上的姿势追踪带来革新。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文 / Valentin Bazarevsky 和 Ivan Grishchenko，研究工程师，Google Research

在增强现实、手语识别、全身姿态控制以及量化周期循环等领域中，视频中的姿势预测可以将数字内容和信息叠加到物理世界，也可由此构成瑜伽、舞蹈和健身等应用的基础功能。健身应用的姿势预测尤其具有挑战性：由于运动时种类繁多身体姿态（如数百种瑜伽体式）、自由度很高、可能存在遮挡物（如从摄像头看到身体或其他物体遮挡四肢）以及各式服装或装饰等。

手语识别
https://youtu.be/N0Vm0LXmcU4
全身姿态控制
https://blog.google/technology/ai/move-mirror-you-move-and-80000-images-move-you/

BlazePose 在健身和舞蹈应用上的示例

今天，我们推出一种全新人体姿态感知方法：BlazePose，我们已在 CVPR 2020 的 CV4ARVR 研讨会上进行过介绍。我们的方法采用机器学习 (ML)，从单帧画面推断人体的 33 个 2D 关键点提供人体姿态追踪。相较于当前基于标准 COCO 拓扑的姿态模型，BlazePose 可以精确定位更多关键点，因此特别适合于健身应用。此外，当前最前沿 (SOTA) 的方法主要依靠强大的桌面环境进行推理，而我们的方法通过 CPU 推理在手机端实现了实时性能。如果利用 GPU 推理，BlazePose 可以实现超实时性能，从而运行后续的 ML 模型，如面部或手部追踪。

BlazePose
https://solutions.mediapipe.dev/pose
介绍
https://arxiv.org/abs/2006.10204

MediaPipe 中的上半身 BlazePose 模型

拓扑网络

人体姿态的当前标准是 COCO 拓扑，由横跨躯干、手臂、腿部和面部的 17 个关键点组成。不过，COCO 关键点只能定位脚踝和腕部的点，缺乏手和脚的比例和方向

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。