HRNet简介

在MMPose代码讲解过程中会经常使用HRNet这个人体姿态估计的top down模型,HRNet的HR不是人力资源管理,而是指high-resolution,高分辨率网络,平常的卷积神经网络,比如VGG也好,ResNet也好,它的网络都是逐渐下采样的,它的长宽,feature map的长宽,是在逐渐减小的,深度是在逐渐增加的,而HRNet不一样,从头到尾一直保持很高的分辨率,它的长宽没有下采样,一直是很高的分辨率。

这就使得像人体姿态估计,目标检测,图像分割,这样的Dense Prediction,像素密集,像素敏感,位置敏感的任务,它的分辨率信息,长宽信息,能够得到很好的保留,不然像传统的卷积神经网络,不断下采样,长宽信息是会丢失的。所以这是HRNet性能卓越的一个重要的原因,没有经过下采样,始终保持高分辨率。

子豪兄给HRNet写的两段文字介绍:

传统的计算机视觉任务用的卷积神经网络叫做Backbone骨干网络,提取特征,这些网络都会逐层下采样,要么是通过pooling池化下采样的,要么是通过步长大于1的卷积 下采样的,它的feature map长宽都会逐渐变小,通道方向逐渐变大,那么意味着长宽方向的空间信息space information会逐渐丢失,对于图像分割,目标检测,关键点检测,姿态识别等像素密集位置敏感这样的 Dense Prediction任务而言,无疑丢失了重要的空间信息。

它的作者是王井东老师,在这个链接中可以看到王井东老师和沈向洋老师录的HRNet论文的讨论视频。

中科大和微软亚研在CVPR 2019开源发布的HRNet,通过网络全过程保持feature map的高分辨率,保留了 长宽位置的空间信息,而且通过独特的三角形网络,倒三角形网络,设计实现了不同分辨率的特征融合, HRNet一举霸榜了MS COCO关键点检测,姿态估计,多人姿态估计三个赛道的冠军。

HRNet专门用来解决Dense Prediction任务,特别是人体姿态估计任务

参考:

AlexNet网络结构-CSDN博客

同济子豪兄MMPose视频讲解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值