前言
文章主要参考B站up主霹雳吧啦Wz,视频链接:https://www.bilibili.com/video/BV1Vq4y127fB/?spm_id_from=333.999.0.0&vd_source=7f4cdb44567f8306191759001e7d7cee
Unet结构的主要贡献在于U型结构,并且常用于生物医学图像上。该结构可以使它使用更少的训练图片的同时,且分割的准确度也不会更差。其左边网络为特征提取网络:使用conv和pool;右边网络为特征融合网络:使用上采样层产生的特征图与左侧的特征图进行拼接。
1.网络结构
2.网络结构操作步骤释义
- conv 3x3:宽3高3的卷积层
- ReLu:激活函数
- copy and crop:复制裁剪
- max pool 2x2:宽2高2的下采样层
- up-conv 2x2:宽2高2的转置卷积层
- conv 1x1:宽1高1的卷积层
- 左边的步骤为contracting path,右边的步骤为expansive path
3.网络结构解读
- 左1:输入宽572高572深度1的特征图(特征矩阵),经过conv 3x3和ReLU激活函数得到宽570高570深度64的特征图,再经过conv 3x3和ReLU激活函数得到568x568x64的特征图
- 左2:568x568x64的特征图经过max pool 2x2得到284x284x64的特征图,再经过conv 3x3和ReLU激活函数得到282x282x128的特征图,后再经过conv 3x3和ReLU激活函数得到280x280x128的特征图
- 左3:280x280x128的特征图经过max pool 2x2得到140x140x128的特征图,再经过conv 3x3和ReLU激活函数得到138x138x256的特征图,后再经过conv 3x3和ReLU激活函数得到136x136x256的特征图
- 左4:136x136x256的特征图经过max pool 2x2得到68x68x256的特征图,再经过conv 3x3和ReLU激活函数得到66x66x512的特征图,后再经过conv 3x3和ReLU激活函数得到64x64x512的特征图
- 中:64x64x512的特征图经过max pool 2x2得到32x32x512的特征图,再经过conv 3x3和ReLU激活函数得到30x30x1024的特征图,后再经过conv 3x3和ReLU激活函数得到28x28x1024的特征图
- 右1:28x28x1024的特征图经过up-conv 2x2和copy and crop得到56x56x1024的特征图,再经过conv 3x3和ReLU激活函数得到54x54x512的特征图,后再经过conv 3x3和ReLU激活函数得到52x52x512的特征图
- 右2:52x52x512的特征图经过up-conv 2x2和copy and crop得到104x104x512的特征图,再经过conv 3x3和ReLU激活函数得到102x102x256的特征图,后再经过conv 3x3和ReLU激活函数得到100x100x256的特征图
- 右3:100x100x256的特征图经过up-conv 2x2和copy and crop得到200x200x256的特征图,再经过conv 3x3和ReLU激活函数得到198x198x128的特征图,后再经过conv 3x3和ReLU激活函数得到196x196x128的特征图
- 右4:196x196x128的特征图经过up-conv 2x2和copy and crop得到392x392x128的特征图,再经过conv 3x3和ReLU激活函数得到390x390x64的特征图,后再经过conv 3x3和ReLU激活函数得到388x388x64的特征图,最后经conv 1x1得到388x388x2的output segmentation map
- 注:左1表示Unet的U型结构左上角的网络结构,其他按网络工作顺序箭头依此类推