https://github.com/MVIG-SJTU/AlphaPose/tree/pytorch
https://arxiv.org/pdf/1812.00324.pdf
1.传统单人姿态估计loss
传统的单人姿态估计模型的loss(以MSE均方误差为例),对于每个关键点而言,传统的计算loss方式如下:
上图中,一个目标框中只对有效人体的关键点进行回归。不考虑背景中出现的其他人体关键点。正因为这种回归方式,在人体拥挤场景下,一个目标框中往往除了有效的人体前景外,背景部分也会有其他人体的关键点,而这些关键点的存在会导致拥挤场景下关键点回归出现混乱。
2.拥挤人体姿态估计loss
本文提出的CrowdPose算法中使用如下所示的loss(以MSE均方误差为例),整体计算示意图如下:
如上图所示,一个目标框中除了对前景人体关键点进行回归外,还对背景中的人体关键的进行回归。直观来说就是每张GT图中会有多个点,最终回归出来的关键点特征图也会存在多个峰值。使用该种回归方式可以有效抑制背景人体关键点对前景人体关键点的影响。在回归过程中如上图中的loss函数所示,会给背景中的人体关键点分配一个小于1的权重。很显然当权重为零时,该方法就和传统的回归方式一