《ICNet for Real-Time Semantic Segmentation on High-Resolution Images》论文笔记

最新推荐文章于 2021-03-03 15:37:14 发布

m_buddy

最新推荐文章于 2021-03-03 15:37:14 发布

阅读量489

点赞数

分类专栏：图像&视频分割文章标签： ICNet

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m_buddy/article/details/90575571

版权

代码地址：ICNet

1. 概述

导读：这篇文章主要研究的是实时场景下的分割任务，现有的方法对于像素级分割是很难在较大比例上减少运算的计算量的。这篇文章对此提供了解决办法，提出了图像级联网络（Image cascade network，ICNet）去解决该问题，这里将输入图像按照尺寸划分为三个支路的输入，分辨率最小的支路的输出开始不断细化分割的结果，引入特征级联混合单元与cascade label guidance strategy快速实现分割，在Cityscapes、CamVideo与COCO-Stuff数据集上实现了单GPU实时分割。

文章中将文章提出的实时分割算法与现有的分割网络进行对比，得出的结果见下图，ICNet在速度与准确度上取得了较好的折中，达到了实时的需求，并且 $IoU\gt70$ 。
在这里插入图片描述
这篇文章提出的网络结构ICNet，该模型兼顾了低分辨下分割的效率与高分辨率下分割的质量。思想：首先让低分辨的图像经过语义分割网络产生粗糙的分割结果；之后特征级联混合单元（cascade label guidance）与标签引导的级联策略（cascade label guidance strategy）将中分辨率和高分辨率的特征整合，逐步地优化之前生成的粗糙分割结果。

文章的主要贡献归纳如下：

1）提出了新的单输入图像级联网络用于图像分割，它使用低分辨率的语义信息与高分辨的细节；
2）使用特征级联混合单元与级联标签引导，在较低计算开销的情况下优化了结果；
3）ICNet在推断速度上提升了5倍，所需要的内存开销也缩小了5倍，在分辨率为 $1024 * 2048$ 的分辨率下也能实现帧率为30FPS的分割；

2. 网络结构设计

2.1 影响分割速度的原因分析

这里使用 $\Phi$ 来表示卷积操作，输入为 $V\in R^{c*h*w}$ ，输出为 $U\in R^{c^{'}*h^{'}*w^{'}}$

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
《ICNet for Real-Time Semantic Segmentation on High-Resolution Images》论文笔记

代码地址：ICNet1. 概述导读：这篇文章主要研究的是实时场景下的分割任务，现有的方法对于像素级分割是很难在较大比例上减少运算的计算量的。这篇文章对此提供了解决办法，提出了图像级联网络（Image cascade network，ICNet）去解决该问题，这里将输入图像按照尺寸划分为三个支路的输入，分辨率最小的支路的输出开始不断细化分割的结果，引入特征级联混合单元与cascade labe...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。