深度学习UNet网络

最新推荐文章于 2024-06-01 19:57:23 发布

Major Tom _

最新推荐文章于 2024-06-01 19:57:23 发布

阅读量362

点赞数 4

文章标签：深度学习网络人工智能

本文链接：https://blog.csdn.net/m0_52474839/article/details/138770257

版权

在这里插入图片描述

DDPM主干模型；

在这里插入图片描述

UNet是一种分类网络架构，输入一张图片，网络进行分类是目标物体还是背景像素？

像素级的判断。

在这里插入图片描述

最终输出是单通道388*388

但是输入是572，输入572是填充过来的

而且UNet使用的是镜像填充

在这里插入图片描述

镜像填充目的是为了让像素点具有上下文信息。

在这里插入图片描述

示意图解释：第一阶段分别对图片进行两次的3*3卷积操作，通道数从1扩充到64
第二阶段开始进行最大池化2*2，对图片进行压缩，但是通道数不变。图片尺寸变小一半 284*284，但是之后进行卷积操作3*3但是通道数从640->128其他不变。
后续操作同理。

右侧可以理解为一个反卷积或者理解为一个解码器也可以

接下来是上采样的过程，其本质也是一种反卷积

其次就是在进行复原的时候，我们要将高像素的特征进行赋值过来

在这里插入图片描述

此过程也可以成为skip connection，但是中间会出现像素不匹配的过程

这样可以进行挖中间部分在这里插入图片描述

64 挖成56

然后与上采样的特征进行拼接操作

之后进行两个卷积操作，3*3的卷积核，只不过通道数发生改变其他不变。

此图上采样都是运用两次卷积操作，然后通道降维

UNet代码实现

实现encoder部分，decoder部分

首先进行一层卷积操作也叫start_conv将单通道映射到64通道

其次要进行四层下采样，每一层下采样包含三个部分

1.最大池化

卷积归一化非线性函数

之后进行1024 到1024的中间层实现起来也是进行两次卷积padding==1

最终进行上采样操作，

每一次上采样，都是一个普通的转置卷积层和两个卷积层构成

最终设置的1*1卷积。最终的任务是做分类任务。

引用量四万

第二个应用，将音频和原声进行分离。

第二篇论文，分离人声伴奏，分离其他也可。甚至可以做抠图操作。

在这里插入图片描述

xconv

在这里插入图片描述

两个卷积操作 + 层归一化+RELU

xconv其实代表每一层的操作了

下采样的过程就是进行xconv操作后进行maxpool操作

在这里插入图片描述

上采样的过程相反

上采样的过程上采样的过程需要进行转置卷积操作+xconv+copy操作

forward的时候需要传入copy

Major Tom _

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
深度学习UNet网络

之后进行1024 到1024的中间层实现起来也是进行两次卷积padding==1。UNet是一种分类网络架构，输入一张图片，网络进行分类是目标物体还是背景像素？上采样的过程上采样的过程需要进行转置卷积操作+xconv+copy操作。之后进行两个卷积操作，3*3的卷积核，只不过通道数发生改变其他不变。其次就是在进行复原的时候，我们要将高像素的特征进行赋值过来。每一次上采样，都是一个普通的转置卷积层和两个卷积层构成。此图上采样都是运用两次卷积操作，然后通道降维。接下来是上采样的过程，其本质也是一种反卷积。
复制链接

扫一扫