实时语义分割之ICNet

最新推荐文章于 2022-07-20 18:25:31 发布

watersink

最新推荐文章于 2022-07-20 18:25:31 发布

阅读量1.2k

点赞数 1

分类专栏：图像分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_14845119/article/details/100997983

版权

图像分割专栏收录该内容

17 篇文章 5 订阅

订阅专栏

论文：ICNet for Real-Time Semantic Segmentation on High-Resolution Images

官网：https://hszhao.github.io/projects/icnet/

Github: https://github.com/hszhao/ICNet

ICNet即图片级联网络（image cascade network），是一款主打实时性的语义分割网络。

主要贡献：

提出了实时的语义风格框架ICNet，通过融合底层语义信息和高层细节信息进行优化。
对于每一个级联的不同尺度的特征都进行loss优化，有助于提高分割结果
相比其他分割网络，ICNet获得了5倍的加速和5倍的内存消耗减少。可以在1024*2048的分辨率下达到30fps。

速度分析：

假设，输入图像为V，输出图像为U，卷积核为K，则最终卷积核的计算量为O

语义分割的几种网络结构对比：

(a)FCN+skip connection

(b)编码+解码结构，像SegNet，DeconvNet，UNet，ENet，LRR，RefineNet

(c)多尺度预测融合的结构，像DeepLab-MSC，PSPNet-MSC

(d)ICNet结构

网络结构：

网络的cascade结构，需要同时输入原图（high resolution），1/2原图（medium resolution），1/4原图（low resolution），这3个不同分辨率的图片。每一个级联模块都进行3次下采样操作，都会进行loss的计算。最终，编码部分下采样3次，解码部分上采样1次。网络部分最终输出的大小为原图的1/4，最终经过上采样操作，还原回原图的尺寸。

其中CCF模块表示级联特征融合模块（cascade feature fusion），具体结构如下图。

其中，上采样操作使用upsample实现。相比反卷积操作，upsample+dilated conv可以使用相同的卷积核大小，收获更大的感受野。比如7*7的deconvolution和upsample+3*3 的dilated conv具有相同的感受野。

损失函数:

基于加权的softmax cross entropy，其中λ1，λ2，λ3，分别为0.4，0.4，1.0。

实验结果：

总结：

ICNet是一个实时的语义分割框架，精度远好于ENet，速度比ENet略慢。

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
实时语义分割之ICNet

论文：ICNet for Real-Time Semantic Segmentation on High-Resolution Images官网：https://hszhao.github.io/projects/icnet/Github: https://github.com/hszhao/ICNetICNet即图片级联网络（image cascade network），...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。