原文连接:https://arxiv.org/abs/2006.01423
文章总结了从2014年起至今的单目人体姿态估计基于深度学习的主流方法,文章主要框架如下:
- 介绍
- 人体姿态识别方法分类和人体模型
- 2D人体姿态估计
- 3D人体姿态估计
- 人体姿态识别常用数据集及评价标准
- 总结及未来研究方向
下面就以翻译原文为主要方式介绍文章的主要内容:
1.介绍
顾名思义,人体姿态识别任务主要是将从传感器中获取的信息中识别到人体姿态。近些年来,随着深度学习在诸多视觉任务(图片分类,目标检测,语义分割等等)表现良好的同时,人体姿态估计领域也取得飞速的进展。发展主要集中于以下几个方面:估计能力越来越强的神经网络结构,丰富的数据集,更多的人体模型探索。本文广泛地回顾了近些年基于深度学习的2D,3D人体姿态估计方法。本文主要针对图像的传感器信息。
人体姿态识别有许多的应用领域,包括虚拟现实,人机交互等等。单目人体姿态估计也有许许多多的挑战。例如自我遮挡,过于复杂的人体姿态,同一图片里面不同人的服装相似,同一人的肢体相似,有的图片仅出现一半人体。
关于人体姿态估计的的论文可以以下面的方式区分:
- 是否使用人体模型:基于模型的产生式方法(generative method),和不基于模型的识别方法(discriminative method)
- 分析的层面:自上而下的方法(先识别人体再拆解肢体),自下而上的方法(先识别肢体再组成人体)
- 更多的区分方法参见下面