用于视觉识别的深度高分辨率表征学习
github:https://github.com/HRNet
论文地址:https://arxiv.org/pdf/1908.07919
摘要
高分辨率表示对于位置敏感的视觉问题是必不可少的,例如人体姿态估计、语义分割和对象检测。现有的最先进的框架首先将输入图像编码为通过子网的低分辨率表示,该子网通过串联连接高到低分辨率卷积(例如,ResNet、VGGNet)而形成,然后从编码的低分辨率表示中恢复高分辨率表示。相反,我们提出的网络,命名为高分辨率网络(HRNet),在整个过程中保持高分辨率表示。
有两个关键特征:(1)并行连接高到低分辨率卷积流;㈡在不同决议之间反复交换信息。好处是,结果表示在语义上更丰富,在空间上更精确。
我们展示了所提出的人力资源网在广泛的应用中的优越性,包括人体姿态估计、语义分割和目标检测,表明HRNet是解决计算机视觉问题的更强有力的支柱。
介绍
我们展示了两个版本的HRNet。第一个名为HRNetV1,只输出从高分辨率卷积流计算的