基于mediapipe的单人人体骨架细节提取

MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。在谷歌,一系列重要产品,如 、Google Lens、ARCore、Google Home 以及 ,都已深度整合了 MediaPipe。本文将介绍的为基于mediapipe的人体骨架提取方案。

1、mediapipe的安装

安装指令如下:

pip install mediapipe

官网地址:MediaPipe  |  Google for Developers
如果需要除了人体骨架提取以外的mediapipe的功能,可以参照官网内的demo进行编写。

2、demo编写

参照官网给的demo进行简要的更改,如下是对视频进行骨架提取,可根据需求更改为摄像头摄像或者照片。

import cv2
import time
import mediapipe as mp

mp_drawing = mp.solutions.drawing_utils
mp_drawing_styles = mp.solutions.drawing_styles
mp_holistic = mp.solutions.holistic

cap = cv2.VideoCapture('1_demo2.mp4')  # 替换为视频路径
fps_start_time = time.time()
fps = 0
with mp_holistic.Holistic(
        min_detection_confidence=0.5,
       
  • 18
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
单人人体姿态估计是计算机视觉领域中的一个重要问题,它旨在从RGB图像或视频中推断出人体的关节点位置和姿态信息。姿态估计在许多应用领域中都具有重要的应用价值,如机器人控制、人体动作分析、运动捕捉等。在过去的几十年中,研究者们提出了许多方法来解决这个问题,其中基于回归和基于检测的方法是两个主要的研究方向。 基于回归的方法是一种直接从图像中回归出关键点位置的方法。这种方法通常将问题转化为回归一个输出向量,其元素表示关键点的坐标值。最初的基于回归的方法是使用手工设计的特征来进行回归,如SIFT、HOG等。然而,这些方法的性能受到了限制,因为它们无法充分捕捉到人体姿态的复杂性和多样性。近年来,随着深度学习技术的发展,基于回归的方法得到了广泛的应用。这些方法通常使用卷积神经网络(CNN)来提取特征,然后通过回归模块来预测关键点的位置。例如,Hourglass网络是一种常用的基于回归的方法,它使用多个Hourglass模块来逐步预测关键点位置。这种方法在关键点定位方面的精度很高,但是在复杂场景下,如人体遮挡、变形、姿势多样性等情况下,它的性能会下降。 基于检测的方法是另一种常用的单人人体姿态估计方法。这种方法先使用目标检测器来检测人体,然后再使用姿态估计算法来对检测到的人体进行姿态估计。这种方法通常具有很好的鲁棒性,因为它可以处理遮挡、姿态多样性等问题。然而,基于检测的方法的主要挑战在于如何设计有效的人体检测器。传统的人体检测器通常是基于手工设计的特征或基于滑动窗口的方法,这些方法的性能受到了一些限制。近年来,随着深度学习技术的发展,基于检测的方法也得到了很大的发展。这些方法通常使用卷积神经网络来进行人体检测,如Faster R-CNN、YOLO等。一旦人体被检测出来,就可以使用基于回归的方法来进行姿态估计。例如,OpenPose是一种基于检测的方法,它使用卷积神经网络来进行人体检测,然后通过回归模块来预测关键点的位置。 综上所述,基于回归和基于检测的方法是两种常用的单人人体姿态估计方法。基于回归的方法通常具有很高的精度,但是在复杂场景下的表现会受到限制。基于检测的方法通常具有很好的鲁棒性,但是需要设计有效的人体检测器。未来,基于回归和基于检测的方法都有着很大的发展空间,特别是在多人姿态估计和视频姿态估计等方面。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值