HRNet简介

鱼儿会飞吗

已于 2024-03-19 19:56:14 修改

阅读量2.1k

点赞数 12

文章标签：计算机视觉人工智能神经网络 cnn 深度学习

于 2024-03-19 19:48:05 首次发布

本文链接：https://blog.csdn.net/qq_34425255/article/details/136853084

版权

在MMPose代码讲解过程中会经常使用HRNet这个人体姿态估计的top down模型，HRNet的HR不是人力资源管理，而是指high-resolution，高分辨率网络，平常的卷积神经网络，比如VGG也好，ResNet也好，它的网络都是逐渐下采样的，它的长宽，feature map的长宽，是在逐渐减小的，深度是在逐渐增加的，而HRNet不一样，从头到尾一直保持很高的分辨率，它的长宽没有下采样，一直是很高的分辨率。

这就使得像人体姿态估计，目标检测，图像分割，这样的Dense Prediction，像素密集，像素敏感，位置敏感的任务，它的分辨率信息，长宽信息，能够得到很好的保留，不然像传统的卷积神经网络，不断下采样，长宽信息是会丢失的。所以这是HRNet性能卓越的一个重要的原因，没有经过下采样，始终保持高分辨率。

子豪兄给HRNet写的两段文字介绍：

传统的计算机视觉任务用的卷积神经网络叫做Backbone骨干网络，提取特征，这些网络都会逐层下采样，要么是通过pooling池化下采样的，要么是通过步长大于1的卷积下采样的，它的feature map长宽都会逐渐变小，通道方向逐渐变大，那么意味着长宽方向的空间信息space information会逐渐丢失，对于图像分割，目标检测，关键点检测，姿态识别等像素密集位置敏感这样的 Dense Prediction任务而言，无疑丢失了重要的空间信息。

它的作者是王井东老师，在这个链接中可以看到王井东老师和沈向洋老师录的HRNet论文的讨论视频。

中科大和微软亚研在CVPR 2019开源发布的HRNet，通过网络全过程保持feature map的高分辨率，保留了长宽位置的空间信息，而且通过独特的三角形网络，倒三角形网络，设计实现了不同分辨率的特征融合， HRNet一举霸榜了MS COCO关键点检测，姿态估计，多人姿态估计三个赛道的冠军。

HRNet专门用来解决Dense Prediction任务，特别是人体姿态估计任务

参考：

AlexNet网络结构-CSDN博客

同济子豪兄MMPose视频讲解