摘要
这篇文章提出了一个新颖的ConvNet架构,应用于人体姿态估计。作者认为重复使用 bottom-up,top-down能够提升网络性能。作者将这个网络命名为“stacked hourglass”(我试着翻译为:栈式沙漏网络)。在FLIC和MPII数据集上,本文取得了超越当前所有方法的性能。
概要介绍
下图是本文的网络结构,包含2个“stacked hourglass”
下图是“stacked hourglass”的详细设计。点线环绕的部分是一个“stacked hourglass”。每个模块的层是相等的。每个box对应一个residual module。
下图是在MPII上面的结果