快速人体姿态估计:CVPR2019论文阅读
Fast Human Pose Estimation
论文链接:
http://openaccess.thecvf.com/content_CVPR_2019/papers/Zhang_Fast_Human_Pose_Estimation_CVPR_2019_paper.pdf
摘要
现有的人体姿态估计方法通常只考虑如何提高模型的泛化性能,而忽略了显著的效率问题。这导致在实际应用中开发可扩展性和成本效益较差的重型模型。在这项工作中,我们研究了研究不足但实际上是关键的位姿模型效率问题。为此,我们提出了一种新的快速位姿蒸馏(FPD)模型学习策略。具体来说,FPD训练了一种轻量级的位姿神经网络结构,能够以低计算成本快速执行。它是通过有效地传递强教师网络的位姿结构知识来实现的。广泛的评估显示了我们的FPD方法在两个标准基准数据集MPII人体姿势和Leeds运动姿势的模型成本效益方面,优于广泛的最新姿势估计方法。
1. Introduction
在这项研究中,我们考虑的问题是在不降低模型性能的前提下,保持可比精度结果的姿态估计效率。我们观察到,最先进的人体姿势网络(如Hourglass[19])的基本CNN构建块在建立小型网络时并不具有成本效益,因为每层有大量的频道,而且更难训练。 为了克服这些障碍,我们设计了一种轻量级的Hourglass网络,并提出了一种更有效的小姿态网络知识提取训练方法[13]。我们称之为快速位姿蒸馏法。
与目前性能最好的替代姿态方法[32,10]相比,本文提出的FPD方法能够在达到相同人体姿态预测性能的同时,以更小的模型尺寸实现更快、更具成本效益的模型推理。我们的贡献总结如下:
(i) 我们研究