官方github
文章地址
微软亚研院出品的单人pose estimation文章,一作是xiao bin大神,也是之后HRNet的二作,实力强大。 考虑到之前提出的人体姿态网络, 例如hourglass, cpn等网络, 虽然效果很好,但它们的结构都比较复杂, 设计的比较繁琐, 很难去确定到底是网络结构的哪一部分对pose的结果有影响。所以文章提出了一个简单的网络结构,来说明或者研究“到底一个简单的网络能够有多好”(how good could a simple method be?)。文章提出的Simple Baseline没有明确的理论作为基础,效果好是通过对比实验得到的,它和之前的网络比也没有任何新的理论提出,仅仅是一个solid baseline for pose estimation。
Backbone为ResNet,在ResNet最后一个stage( C 5 C_{5}