深度学习高遥感影像语义分割

最新推荐文章于 2024-07-29 17:15:22 发布

???111

最新推荐文章于 2024-07-29 17:15:22 发布

阅读量1.3w

点赞数 12

文章标签：人工智能 python 大数据

原文链接：http://www.cnblogs.com/wzp-749195/p/11114624.html

版权

本文探讨了深度学习在遥感影像语义分割领域的进展，介绍了Unet、Deeplab（包括V3+）和CEnet等网络结构，以及它们在特征提取和融合方面的设计。通过实验对比，展示了Inceptionv3和Mobilenetv2在网络性能和效率上的差异。文章强调了针对特定任务设计网络参数的重要性，并提到了自动化语义分割网络AutoDeeplab的未来发展方向。

摘要由CSDN通过智能技术生成

深度学习遥感影像语义分割

深度学习大家都知道，在计算机视觉领域取得了很大的成功，在遥感影像自动解译方面，同样带来了快速的发展，我在遥感影像自动解译领域，也做了一些微薄的工作，发表几篇论文，我一直关注遥感影像自动解译领域，

在北京出差的这段时间，终于可以沉下心来，好好研究下深度学习，目前在语义分割领域，也有部分心得，在此同大家分享，权当是互相学习。本篇博文就是论述现有的state-of-art方法在遥感影像语义分割领域的进展，及以后的发展方向！

首先不多说，我采用当前效果表现最稳定、精度较高的几种语义分割网络进行讲述：1.unet网络；2.Deeplab网络（mobile特征提取器，resnet18特征提取器，resnet50特征提取器，Inceptionv3特征提取器等）；3.CEnet。

下面我对这几种网络进行简单的讲解，单纯作为抛砖引玉，如有个别不当的地方，请看到的专家不吝赐教，Email：1044625113@qq.com，Phone：15211874660。如果大家需要全套遥感影像语义分割代码，同样可以联系我。

1.unet网络

unet网络由于形状像一个u型，因此称为Unet网络，关于它的资料，大家可以在CSDN的一篇博客找到，介绍的论文太多我就不细讲了！

它的形状如下图所示：

图1 unet语义分割网络（参考unetCSDN博客）

从它的形状，我们可以看出，非常优美，这是原版论文的架构，我们可以在这个基础上进行大量的改进，比如说，特征提取块，我们可以采用残差网络（resnet）进行替换，这有什么好处呢？主要是可以加深网络，在防止梯度消失的同时，

可以学习到更深层次的特征，有利于提高精度。我看了几个版本的代码，在特征融合层，大家普遍采用两种方式，第一种直接相加，即将编码层与解码层特征直接相加，另外一种就是常用的concat，关于这两种有什么优缺点，我个人的理解是，

concat可以融合更多特征，其实说白了就是以前的向量相加（vector stacking），效果好的同时，GPU的显存肯定要消耗大；而对于特征相加的方式，直观的表现就是节省GPU显存，但是呢，是否比concat更好呢？我这里没有做实验，大家可以

跑跑代码试试！

2.Deeplab网络

图3 DeeplabV3plus语义分割网络（参考原作者论文）

其实从Deeplab的网络可以看出，这个网络简单优美，没有那么多复杂的组合等等，最核心的东西就是四个空洞卷积块，卷积核的大小分别是1 6 12 18，关于作者为什么只用这四个参数呢，作者也只是用实验进行了说明，

证明了用这四个参数可以获得最高的精度，另外一种解析就是，不同大小的空洞卷积核可以感受不同范围的特征。第二个比较重要的地方，就是与四倍采样大小的特征进行concat，这个比较重要，它融合了编码层与解码层的<

最低0.47元/天解锁文章

关注

12
点赞
踩
125

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。