https://arxiv.org/pdf/1602.00134.pdf
CPM基本上可以算是第一个end-to-end的单人姿态全卷积神经网络(同时期还有个Hourglass,两者时间差不多)。CPM是在之前PM(Pose Machines)基础上,加入卷积神经网络得到,CPM整体流程如下所示:
(a)和(b)就是PM中的结构,(c)(d)则是CPM对应(a)(b)做的改进。CPM分为多个stage串联进行关键点预测,大致如下:
- Stage 1接受原图作为输入,通过7个convolution和3个pooling得到 h ′ ∗ w ′ ∗ ( P + 1 ) h^{'} * w^{'} * (P+1) h′∗