unet模型及代码解析

最新推荐文章于 2024-08-02 22:07:39 发布

GSAU-深蓝工作室

最新推荐文章于 2024-08-02 22:07:39 发布

阅读量2.8w

点赞数 25

文章标签：人工智能神经网络深度学习 pytorch

本文链接：https://blog.csdn.net/weixin_40604528/article/details/121562771

版权

U-Net是一种用于图像分割的深度学习模型，以其独特的U型结构著称，解决了FCN在上下文信息和位置信息方面的不足。模型包括对称的编码器和解码器，编码器用于特征提取，解码器则通过特征融合恢复高分辨率信息，实现精确分割。U-Net的创新在于其跳跃结构，通过特征图的拼接而非加法来融合不同层级的特征，从而提高了分割精度。相比于FCN，U-Net的特征融合更彻底，适用于多种尺寸输入的图像分割任务。

摘要由CSDN通过智能技术生成

什么是unet

一个U型网络结构，2015年在图像分割领域大放异彩，unet被大量应用在分割领域。它是在FCN的基础上构建，它的U型结构解决了FCN无法上下文的信息和位置信息的弊端。

Unet网络结构

主干结构解析

左边为特征提取网络（编码器），右边为特征融合网络（解码器）

高分辨率—编码—低分辨率—解码—高分辨率

特征提取网络

高分辨率—编码—低分辨率

前半部分是编码, 它的作用是特征提取(获取局部特征,并做图片级分类)，得到抽象语义特征

由两个3x3的卷积层（RELU）再加上一个2x2的maxpooling层组成一个下采样的模块，一共经过4次这样的操作

特征融合网络

低分辨率—解码—高分辨率

利用前面编码的抽象特征来恢复到原图尺寸的过程, 最终得到分割结果(掩码图片)

由一层反卷积+特征拼接concat+两个3x3的卷积层（ReLU）反复构成，一共经过4次这样的操作，与特征提取网络刚好相对应，最后接一层1*1卷积，降维处理，即将通道数降低至特定的数量，得到目标图。

FCN与UNet特征融合操作对比解析

FCN是通过特征图对应像素值的相加来融合特征的

Torch代码：

concat1 = out1+out2
# 其中out1与out2都是torch中的tensor格式

unet是通过同维度矩阵拼接来融合特征的

torch代码：

concat2 = torch.cat([convt1,conv4],dim=1)
# dim = 1 意味着在第1维度方向（第1维也就是列为4的方向）进行叠加
# 对于更高维的数据，也就是在dim = x 时，即x所对应维度方向进行叠加

<

最低0.47元/天解锁文章

GSAU-深蓝工作室

关注

25
点赞
踩
150

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫