创新点
能够从头到尾保持高分辨率,不同分支的信息交互是为了补充通道数减少带来的信息损耗
应用
对于检测、分割、面部对齐、姿态估计(需要生成一个高分辨率的heatmap来进行关键点检等问题,位置敏感,需要高分辨率表征。
整体结构
不同分辨率feature map之间的交互
普通网络是下图结构
一般的方法都是使用卷积神经网络进行不断地降采样,包括resnet和vggnet等,然后再恢复高分辨率。而HRnet的特点在于把串行的结构做成并行的,把降低分辨率的操作改成保持分辨率的操作。
FuseLayer
融合模块的目的是每个阶段的每条支流的输出都能从其他并行支流的输出中接收信息。高层特征图向低层进行融合,则是将高层特征图上采样到和低层图一样的尺寸,然后进行相加拼接。对于低层特征向高层特征进行融合,则是通过经过一个3x3,stride为2的卷积进行下采样,达到和高层同样维度进行拼接。
输出头Head
(a )HRNetV1
输出仅是来自high-resolution stream的表示。其他三个表示将被忽略
(b)HRNetV2
我们通过bilinear upsampling对低分辨率表示进行缩放,而不改变高分辨率的通道数,并将四种表示连接起来,然后进行1 × 1卷积来混合这四种表示
(c)HRNetV2p
通过将HRNetV2的高分辨率表示输出向下采样到多个级别来构建多级表示
激活函数
leaky_Relu