语义分割论文解读三（HRNetv1, HRNetv2）

最新推荐文章于 2024-04-25 09:38:40 发布

蓝鲸鱼BlueWhale

最新推荐文章于 2024-04-25 09:38:40 发布

阅读量2.8k

点赞数 3

分类专栏：语义分割计算机视觉文章标签：深度学习神经网络计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44579633/article/details/121052600

版权

计算机视觉同时被 2 个专栏收录

56 篇文章 24 订阅

订阅专栏

8 篇文章 4 订阅

订阅专栏

本文介绍同一作者在Deep High-Resolution Representation Learning for Human Pose Estimation和SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers中提出的两篇高分辨率网络，称为HRNetv1和HRNetv2。

HRNetv1

论文SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers提出了高分辨率网络HRNetv1。

论文指出，现有的最先进的框架首先通过一个连接高分辨率到低分辨率卷积序列的子网络，将输入图像编码为低分辨率表示，然后从编码的低分辨率表示中恢复高分辨率表示。四种典型的姿态估计网络如下图所示。(a)Hourglass 。(b)级联金字塔网络。© SimpleBaseline：用于低到高处理的转置卷积。(d)结合了扩张卷积。在这里插入图片描述
相反，论文中提出的高分辨率网络HRNet在整个过程中保持高分辨率表示。该方法有两个关键特征：

并行连接高分辨率到低分辨率的卷积流
反复交换各分辨率网络的信息。

如下图所示，HRNet从一个高分辨率的卷积流开始，逐步添加高分辨率到低分辨率的卷积流，并将多分辨率的卷积流并行连接。水平方向和垂直方向分别对应于网络的深度和特征图的比例尺。

在这里插入图片描述
从高分辨率卷积流作为第一阶段开始，逐步添加高分辨率到低分辨率的流，形成新的阶段，并将多分辨率流并行连接。因此，后一阶段的平行流的分辨率由前一阶段的分辨率和一个更低的分辨率组成。

其中，融合模块的目标是在多分辨率表示之间交换信息。融合3个分辨率的例子如下：

在这里插入图片描述

HRNetv2

论文SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers中对HRNetV1进行了扩展：

将HRNetV1扩展为两个版本：hrnetv2和HRNetV2p。
将分辨率拓展为四种，如下图所示。

作者提出有三种表示头，分别称为HRNetV1、HRNetV2和HRNetV1p。

（a）HRNetV1：只输出高分辨率卷积流的表示。
（b）HRNetV2：连接来自所有分辨率的（上采样）表示。
（c）HRNetV2p：由HRNetV2表示构成特征金字塔。

每个子图底部的四分辨率表示是从上图中的网络输出的，灰色框表示如何从输入的四分辨率表示获得输出表示。在这里插入图片描述

蓝鲸鱼BlueWhale

关注

3
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
语义分割论文解读三（HRNetv1, HRNetv2）

本文介绍同一作者在Deep High-Resolution Representation Learning for Human Pose Estimation和SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers中提出的两篇高分辨率网络，称为HRNetv1和HRNetv2。HRNetv1论文SegFormer: Simple and Efficient Design for Semantic
复制链接

扫一扫

专栏目录

蓝鲸鱼BlueWhale CSDN认证博客专家 CSDN认证企业博客

码龄6年

103: 原创

4857: 周排名

130万+: 总排名

25万+: 访问

: 等级

2128: 积分

2万+: 粉丝

485: 获赞

218: 评论

1884: 收藏

私信

关注

热门文章

分类专栏

最新评论

PV-RCNN代码解读——demo.py & test.py
Wxy.Wd: 请问demo的运行结果是两个场景的检测结果的意思，还是右图是左图经过模型处理后的检测结果，与左图进行对比的意思？
PV-RCNN代码解读——demo.py & test.py
三维小新: 你好请问直到这些参数代表什么了吗
检测数据库detectron2代码解析（二）BACKBONE
小珑gg22mm: model = META_ARCH_REGISTRY.get(meta_arch)(cfg) 运行后就会调用所有模型，这个就是个黑盒，看不到哪里里合并了那么多模型。 meta_arch = cfg.MODEL.META_ARCHITECTURE #输出：GeneralizedRCNN model = META_ARCH_REGISTRY.get(meta_arch)(cfg) # 类似于：detectron2.modeling.meta_arch.rcnn.GeneralizedRCNN(cfg) print(model) #这里就显示了所有模型，太奇怪了，也没看到在哪里调用，只知道运行到上面的： detectron2.modeling.meta_arch.rcnn.GeneralizedRCNN 文件中，而已,太懵逼了
网络参数重组论文二（ACNet，RepMLP）
sfcv159: 想问一下博主，ACNet怎么即插即用呀，求教
蒸馏论文四（Relational Knowledge Distillation）
qq_52542087: 你好，针对角度蒸馏所做的loss，那么会形成多少个角度组合呢？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。