图像分割算法Unet中的上采样（反卷积）

最新推荐文章于 2025-04-03 21:14:34 发布

三分正常冰

最新推荐文章于 2025-04-03 21:14:34 发布

阅读量6.4k

点赞数 2

分类专栏：深度学习文章标签：算法人工智能深度学习

本文链接：https://blog.csdn.net/qq_35326529/article/details/128099209

版权

深度学习专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了Unet模型在语义分割中的工作原理，重点讨论了下采样和上采样的过程。下采样通过卷积、批量归一化和ReLU激活函数提取特征；上采样则采用可学习的反卷积网络，以恢复图像的特征。早期的上采样方法如填充0或最近邻插值存在局限，而学习型反卷积使得网络能够训练上采样过程，提高了语义分割的准确性。文章还通过实例解释了卷积运算的计算过程，并指出反卷积并非完全逆运算，主要用于恢复图像维度而非像素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在Unet模型当中，是先通过四个下采样提取目标特征，再通过四个上采样，然后挨个对特征当中的每一个像素点进行分类，从而达到语义分割的目的。

下采样的过程，就是很传统的卷积神经网络的卷积层，先通过Conv2D进行卷积，然后BatchNormalization进行批量正则化，然后进Relu激活函数层。其中核心算法就是卷积的过程，通过卷积核在图像上移动，得到结果。

而上采样的过程是一个反卷积的过程，在早期的语义分割任务中，网络模型涉及到上采样操作，最常见的就是通过填充0或者最近邻插值的方式来完成上采样。这种方法简单粗暴但是缺点也很明显，没有办法实现图像的还原，整个过程不可学习。

在ICCV 2015年的《Learning Deconvolution Network for Semantic Segmentation》论文中提出了可学习的反卷积网络，不再通过填充0或者最近邻插值方法来完成上采样，让整个过程变成可学习，在图像语义分割网络中实现了对上采样过程的训练。在论文中提到的反卷积，更加准确的说法应该是转置卷积。

卷积的过程

在4*4的二维矩阵D中，使用一个3*3的卷积核，得到的结果是一个2*2的矩阵，结果为

|12 12|

|10 17|

其运算过程为

（0,0） 12	0x3+1x3+2x2+2x0+2x0+0x1+0x3+1x1+2x2=12
（0,1） 12	0x3+1x2+2x1+2x0+2x1+0x3+0x1+1x2+2x2=12
（1,0） 10	0x0+1x0+2x1+2x3+2x1+0x2+0x2+1x0+2x0=10
（1,1） 17	0x0+1x1+2x3+2x1+2x2+0x2+0x0+1x0+2x2=17

其运算过程，就是卷积核在矩阵上对应位置点乘线性组合得到的输出。

卷积计算可以看做是参数矩阵和输入矩阵相乘，Y是输出，C是参数矩阵，X是输入矩阵