本文是对19年论文,对OpenPose改进版的论文进行解析。因为改进版官方代码未找到,所以本文单纯从论文层面对模型进行解析。本文只对算法流程,模型构建,Loss构成,公式整理,关键要点等进行整合解析,其他部分可以自己祥阅原论文,如贪婪算法的改进,新的脚部数据集等,但不妨碍对OpenPose的整体架构,模型,思想的理解。
17年版本论文地址:https://arxiv.org/abs/1611.08050
19年版本论文地址:https://arxiv.org/abs/1812.08008
OpenPose为姿势估计模型中的经典模型,16年提出第一代及论文之后,19年对OpenPose进行改进,在提高7%精度的同时,还提高了200%的运行速度。OpenPose采用的是自底向上的方式,先预测关键点,在对关键点进行组合成个体(人)。
模型结构图:
模型分为3部分
第一部分为F,为特征提取模块,使用的是vgg
第二部分为蓝色区域Stages L ,称为PAFs(Part Affinity Fields),用于预测躯干&