六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

姿态估计的目标是在RGB图像或视频中描绘出人体的形状,这是一种多方面任务,其中包含了目标检测、姿态估计、分割等等。有些需要在非水平表面进行定位的应用可能也会用到姿态估计,例如图形、增强现实或者人机交互。姿态估计同样包含许多基于3D物体的辨认。

在这篇文章中,Model Zoo的作者汇总了几种开源的深度学习模型以及针对姿态估计的代码,论智对其进行了编译,如有遗漏请在评论中补充。

1.DensePose

六种人体姿态估计的深度学习模型和代码总结

创作这篇文章的初衷就来源于Facebook研究所的DensePose,上周,Facebook公布了这一框架的代码、模型和数据集,同时发布了DensePose-COCO,这是一个为了估计人类姿态的大型真实数据集,其中包括了对5万张COCO图像手动标注的由图像到表面的对应。这对深度学习研究者来说是非常详细的资源,它对姿态估计、身体部位分割等任务提供了良好的数据源。

DensePose的论文中提出了DensePose-RCNN,这是Mask-RCNN的一种变体,可以以每秒多帧的速度在每个人体区域内密集地回归特定部位的UV坐标。它基于一种能将图像像素通过卷积网络映射到密集网格的系统——DenseReg。模型的目标是决定每个像素在表面的位置以及它所在部分相对应的2D参数。

DensePose借用了Mask-RCNN的架构,同时带有Feature Pyramid Network(FPN)的特征,以及ROI-Align池化。除此之外,他们在ROI池化的顶层搭建了一个全卷积网络。想了解DensePose更多的技术细节,请阅读原论文。

论文地址:arxiv.org/abs/1802.00434

GitHub地址:github.com/facebookresearch/Densepose

数据集地址:github.com/facebookresearch/DensePose/blob/master/INSTALL.md#fetch-densepose-data

2.OpenPose

六种人体姿态估计的深度学习模型和代码总结

OpenPose是由卡内基梅隆大学认知计算研究室提出的一种对多人身体、面部和手部形态进行实时估计的框架。

OpenPose同时提供2D和3D的多人关键点检测,同时还有针对估计具体区域参数的校准工具箱。OpenPose可接受的输入有很多种,可以是图片、视频、网络摄像头等。同样,它的输出也是多种多样,可以是PNG、JPG、AVI,也可以是JSON、XML和YML。输入和输出的参数同样可以针对不同需要进行调整。

OpenPose提供C++API,以及可以在CPU和GPU上工作(包括可与AMD显卡兼容的版本)。

GitHub地址:github.com/CMU-Perceptual-Computing-Lab/openpose

数据集地址:domedb.perception.cs.cmu.edu/

3.Realtime Multi-Person Pose Estimation

六种人体姿态估计的深度学习模型和代码总结

这一模型和上面的OpenPose高度相关,同时特征模型能与多种框架相关联。论文的作者提供了一种自下而上的方法,对多人的姿态进行实时估计,不需要用任何人物探测器。

这种方法运用了一种非参数表示,我们称为Part Affinity Fields(PAFs),用它可以学习将图中人物和其身体部位联系到一起。有关该技术的具体细节和理论,可以阅读原文。

另外,这一方法最棒的特征之一就是它可以在多种不同的框架中实现,针对不同框架,已经公开了相关代码和模型:

论文地址:arxiv.org/abs/1611.08050

GitHub地址:github.com/ZheC/Realtime_Multi-Person_Pose_Estimation

4.AlphaPose

六种人体姿态估计的深度学习模型和代码总结

AlphaPose是一款精准的多人姿态评估工具,并声称是第一款开源系统。AlphaPose既可以在图片、视频或多图中进行姿态估计,也能在画面中对动作进行追踪。它的输出形式非常广泛,包括PNG、JPG和AVI等具有关键点的图片形式,也有JSON格式的输出,这一特点也使其成为众多应用受欢迎的工具。

六种人体姿态估计的深度学习模型和代码总结

目前,这一工具支持TensorFlow和PyTorch两种实现。AlphaPose利用一种区域性的多人动作估计框架将不精准的人类边界框该进程精确的动作估计。这里有三种元素:对称空间转换网络(SSTN)、参数化姿态非极大抑制(NMS)以及姿态导向的生成器(PGPG)。更多技术细节请查看原论文。

论文地址:arxiv.org/abs/1612.00137

GitHub地址:github.com/MVIG-SJTU/AlphaPose

5.Human Body Pose Estimation

六种人体姿态估计的深度学习模型和代码总结

该模型利用MPII人类姿势数据集进行训练,这是一个内容十分丰富的数据集,专门针对人类姿态估计。目前只有TensorFlow的实现。

这项研究将人类姿态估计的任务应用到真实的图片中,他们的方法既解决了动作识别,也能进行估计,与之前先检测人类动作在对此进行推测的技术有所区分。在实施过程中用到了基于CNN的探测器和整数线性规划法。

ArtTracker论文:arxiv.org/abs/1612.01465

DeeperCut论文:arxiv.org/abs/1605.03170

网站地址:pose.mpi-inf.mpg.de/

GitHub地址:github.com/eldar/pose-tensorflow

6.DeepPose

六种人体姿态估计的深度学习模型和代码总结

相比于前面几种方法来说,DeepPose算是比较“古老”的了,论文发布与2014年,提出了一种基于深度神经网络的姿态估计方法,是基于DNN向身体关节回归的问题。它以一种整体的方式估计姿态,并且表述起来非常简洁强大。

目前网上还没有官方实现过程。但是有人做出了复现结果:

DeepPose是第一个将深度学习应用到人类姿态估计上的应用,并且取得了当时顶尖的结果,成为了其他方法的baseline。

论文地址:static.googleusercontent.com/media/research.google.com/zh-CN//pubs/archive/42237.pdf

小结

姿态估计是计算机视觉领域一个非常热门的话题,Facebook最近发布的DensePose让人越来越多地关注这个问题。进行姿态估计有很多方法,现有的资源一定可以对你有所启发。如果你有其他的好方法,请在下面留言分享!

原文地址:modelzoo.co/blog/deep-learning-models-and-code-for-pose-estimation

  • 10
    点赞
  • 73
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 好的,这里是 20 个深度学习模型用于姿态估计的推荐: 1. 2D/3D Convolutional Neural Networks 2. Recurrent Neural Networks 3. Self-supervised Learning 4. Generative Adversarial Networks 5. Attention-based Networks 6. Graph Neural Networks 7. Multi-view Networks 8. Convolutional Pose Machines 9. End-to-end Learning 10. Hybrid Networks 11. Part-based Networks 12. Deformable Part Models 13. Dense Regression Networks 14. Spatial Transformer Networks 15. Adversarial Training 16. Deep Reinforcement Learning 17. Generative Models 18. Transfer Learning 19. Domain Adaptation 20. Few-shot Learning ### 回答2: 姿态估计是计算机视觉领域中的重要任务,它涉及到对人体或者物体在图像或者视频中的关键点进行定位和跟踪。下面是其中一些比较常用的姿态估计深度学习模型: 1. Hourglass:采用自顶向下的多尺度处理方式,通过逐步下采样和上采样来逼近姿态关键点。 2. OpenPose:结合了卷积神经网络和图像处理技术,能够同时估计多个人体关键点。 3. AlphaPose:使用融合的深度回归网络和判别式模型,能够准确预测人体关键点。 4. CPN(Convolutional Pose Machines):通过堆叠多个卷积网络来逐步提炼姿态特征,从而实现关键点的准确定位。 5. Squeeze-and-Excitation Network:采用通道注意力机制,能够自适应地提取姿态特征。 6. HRNet(High-Resolution Network):通过同时利用高分辨率和多尺度特征进行姿态估计,能够提升准确性。 7. PoseNet:借鉴了图像特征和姿态信息之间的关系建立一个深度神经网络模型。 8. SPPE(Simple Pose Part Estimation):通过训练两个子网络,一个进行关键点热图预测,一个用于姿态矩阵估计。 9. ResNet:利用残差连接来构建深度卷积神经网络,适用于姿态估计任务。 10. Stacked Hourglass Attention Network:利用注意力机制来指导姿态关键点的预测。 11. Integral Human Pose Regression:通过估计关键点的密集度矩阵来提高姿态估计的精度。 12. Natural Language Pose Estimation:结合自然语言处理技术,实现对图像或视频中的姿态进行描述和预测。 13. LSTM Pose Machines:利用长短期记忆网络,实现对时间序列中姿态的预测。 14. CPM+OHPM(Orphan Hourglass Pose Machine):结合主干卷积网络和分支网络,能够同时估计多个关键点。 15. DensePose:将姿态估计任务转化为像素到三维点的映射问题,实现密集而准确的姿态估计。 16. PAF(Part Association Fields):通过学习连接人体关键点的概率热图,实现对复杂姿态的估计。 17. Cascaded Pyramid Network:通过级联的金字塔结构,逐步提取姿态特征并进行联合估计。 18. Realtime Multi-Person 2D Pose Estimation:实现实时多人姿态估计,通过基于相机中心和深度优化的关键点匹配算法提高准确性。 19. DeepPose:采用深层卷积神经网络,通过端到端的训练实现姿态估计。 20. Deformable Part Models:结合深度学习和非刚性图像变换技术,实现对非刚性物体(如人体姿态的估计。 ### 回答3: 推荐以下20个姿态估计深度学习模型: 1. OpenPose:使用卷积神经网络进行多人姿态估计。 2. AlphaPose:基于实时多人姿态估计的开源系统。 3. PoseNet:使用卷积神经网络进行单人姿态估计。 4. HRNet:使用高分辨率表示网络进行姿态估计,具有较高的准确度。 5. SimplePose:使用特征金字塔网络进行单人姿态估计。 6. CPN:使用循环多尺度特征金字塔网络进行多人姿态估计。 7. DensePose:基于Mask R-CNN的姿态估计框架,能够推断出人体的密集表面网格。 8. SPPE:基于Spatial Pyramid and Graph Parsing Engine的姿态估计模型,能够进行多人姿态估计。 9. Stacked Hourglass Network:使用堆叠的Hourglass网络进行姿态估计,具有较高的准确度。 10. Integral Human Pose Regression:使用全卷积网络进行单人姿态估计。 11. HMR:使用循环神经网络进行人体姿态和形状估计。 12. VisualSFM:使用结构光扫描和特征提取进行姿态估计。 13. PoseTrack:用于多人姿态估计和追踪的数据集和基准。 14. RMPE:基于循环网络的多人姿态估计模型,具有较高的鲁棒性。 15. Cascaded Pyramid Network:使用金字塔形状网络进行多人姿态估计模型。 16. MultiPoseNet:基于多任务学习的多人姿态估计模型。 17. CPN-RNN:在CPN的基础上引入循环神经网络,提高姿态估计的准确度。 18. RMPE+SDN:RMPE在姿态估计任务上引入了空间注意力模块。 19. Convolutional Pose Machines:使用卷积神经网络进行姿态估计模型。 20. Mask R-CNN:用于实例分割和人体姿态估计深度学习模型。 以上是一些常见的姿态估计深度学习模型,可以根据具体需求选择适合的模型进行姿态估计

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值