一、任务划分
MMPose 是利用深度学习算法对人体姿态进行估计的算法库。而人体姿态估计 是指:
从给定图像中识别人脸、手部、身体等关键点
其中
输入: 图像 I
输出:所有关键点的像素坐标 (x_1, y_1), (x_2, y_2), ..., (x_j, y_j) , 这里 J 为关键点的总数
以上是针对二维平面的,实际应用中还有需要对三位空间中的坐标进行估计,即 3D 姿态估计。
那么从 2D 到 3D,输出都是作为平面或者空间中的坐标。而在人体姿态估计中还有一类任务是 人体参数化模型
以及对 视频中人的行为、特征点的时序变化的分析,称为行为识别。
二、2D 姿态估计
关键点估计最容易想到的方法就是用神经网络直接回归每个点的坐标,如同单阶段的目标检测预测目标框位置一样。这