U-Net学习总结（附DeepLab v3）

最新推荐文章于 2024-08-19 09:04:27 发布

aift

最新推荐文章于 2024-08-19 09:04:27 发布

阅读量2.3k

点赞数 2

分类专栏：深度学习（DL）计算机视觉（CV）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ft_sunshine/article/details/98985955

版权

深度学习（DL）同时被 2 个专栏收录

37 篇文章 37 订阅

订阅专栏

计算机视觉（CV）

19 篇文章 7 订阅

订阅专栏

文章目录

简介

本论文主要亮点：

（1）改进了FCN，把扩展路径完善了很多，多通道卷积与类似FPN（特征金字塔网络）的结构相结合。

（2）利用少量数据集进行训练测试，为医学图像分割做出很大贡献。

这是比较早的论文了，这篇论文比较简单，但是却非常的经典。而且U-Net和之前的FCN很像。总之，U-Net在医学图像分割领域简直是baba一般的存在。

U-Net

U-Net是原作者参加ISBI Challenge提出的一种分割网络，能够适应很小的训练集（大约30张图）。U-Net与FCN都是很小的分割网络，既没有使用空洞卷积，也没有后接CRF，结构简单。
在这里插入图片描述
整个U-Net网络结构如上图所示，类似于一个大大的U字母：首先进行Conv+Pooling下采样；然后Deconv反卷积进行上采样，crop之前的低层feature map，进行融合；然后再次上采样。重复这个过程，直到获得输出388x388x2的feature map，最后经过softmax获得output segment map。总体来说与FCN思路非常类似。

为何要提起U-Net？是因为U-Net采用了与FCN完全不同的特征融合方式：拼接！
在这里插入图片描述
与FCN逐点相加不同，U-Net采用将特征在channel维度拼接在一起，形成更“厚”的特征。所以，语义分割网络在特征融合时也有2种办法：

FCN式的逐点相加，对应caffe的EltwiseLayer层，对应tensorflow的tf.add()；
U-Net式的channel维度拼接融合，对应caffe的ConcatLayer层，对应tensorflow的tf.concat()；

额。。。。。。以上基本就是U-Net的创新点了，就不多废话了。（现在看来，够简单吧，这可是当年医学图像分割的顶会论文）

总结一下，CNN图像语义分割也就基本上是这个套路：

下采样+上采样：Convlution + Deconvlution／Resize；
多尺度特征融合：特征逐点相加／特征channel维度拼接；
获得像素级别的segement map：对每一个像素点进行判断类别；

看，即使是更复杂的DeepLab v3+依然也是这个基本套路（至于DeepLab以后再说）。
在这里插入图片描述
所以作为一篇入门文章，读完后如果可以理解这3个方面，也就可以了；当然CNN图像语义分割也算入门了。

done~

References

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。