来自微软和中国科技大学研究学者的论文《Deep High-Resolution Representation Learning for Human Pose Estimation》和相应代码已经公布。
该文为第一作者Ke Sun在微软亚洲研究院实习期间发明的算法。
作者观察到,现有姿态估计算法中往往网络会有先降低分辨率再恢复高分辨率的过程,比如下面的几种典型网络。
(a) Hourglass (b) Cascaded pyramid networks(c)Simple Baseline (d) Deepercut
作者希望不要有这个分辨率恢复的过程,在网络各个阶段都存在高分辨率特征图。
在上图中网络向右侧方向&