在人体姿态估计领域,深度学习确实是为人体姿态估计插上了翅膀,最早的一篇是CVPR2014的 DeepPose,是首个使用深度卷积神经网络实现的人体姿态估计方法,是一个Regression方法,再后来又有了 OpenPose,AlphaPose RMPE,DeepCut,Mask R CNN,Simple Baselines,HRNet,RLE,这样的算法,这些算法性能越来越强,模型越来越深,效果越来越好,速度也越来越快,这里重点讲解3个算法 OpenPose和Mask R-CNN和HRNet,其中Mask R-CNN会单独做一期论文精读,所以这里重点看OpenPose和HRNet。
OpenPose是卡内基梅隆大学2018年开源的多人姿态检测的项目。
子豪兄视频中讲到:和这个项目也十分有缘分, 2018年11月份那会子豪兄到刚读研一,子豪兄就给这个项目写了个中文文档,在Github上中文文档也是子豪 兄翻译的,子豪兄回忆讲到当时根本不会编程,不会写代码,但仍然在Github上参加了很多开源项目,参加开源项目的主要形式就是翻译中文文档,现在这个中文文档已经有20多万人看过了,也有很多中国开发者是通过子豪兄这个博客了解到OpenPose这个项目的,这个OpenPose的logo是一个O,一个P,很富有美感, 它是多人的。
卡内基梅隆大学为了设计这个数据集,为了构造这个数据集,专门在校内建立了一个蜂巢,里面布满 了红外摄像头,和各种各样的传感器,还有Kinect这样的3D传感器,用它来做出数据集,所以这是OpenPose的特色,首先它是多人的,然后数据集的采集是非常科学的,但是OpenPose的问题在于运算速度特别慢,而且毕竟是2018年的老算法,它的各种环境配置,各种代码,已经跟不上现在的深度学习的潮流。
参考:
同济子豪兄MMPose视频讲解