unet学习笔记（milesial/Pytorch-UNet）

山河故人938

已于 2022-06-19 14:35:41 修改

阅读量2k

点赞数 3

文章标签： pytorch 学习深度学习

于 2022-05-25 19:19:39 首次发布

本文链接：https://blog.csdn.net/weixin_67138138/article/details/124801532

版权

本文档是作者作为初学者对UNet网络结构的学习笔记，包括原理介绍、多分类问题讨论和PyTorch实现的代码解读。重点讲解了UNet的skip-connection、特征融合和多分类问题的处理，以及训练、评估和预测过程中的关键点。

摘要由CSDN通过智能技术生成

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

小白一个，只是学习记录，有问题欢迎大佬指出

所用到的代码Pytorch-UNet/predict.py at master · milesial/Pytorch-UNet ·GitHub

原理讲解

在这里插入图片描述

蓝/白色框表示 feature map；
蓝色箭头表示 3x3 卷积，用于特征提取；
灰色箭头表示skip-connection，用于特征融合；
红色箭头表示池化 pooling，用于降低维度；绿色箭头表示上采样
upsample，用于恢复维度；青色箭头表示 1x1 卷积，用于输出结果。

在这里插入图片描述

多分类问题

对于多分类问题，以下做法只是代码可以运行，不能从本质上解决多分类问题
代码能运行的原因也是因为强制将多分类问题改为了二分类方法

        if not is_mask:
            if img_ndarray.ndim == 2:
                img_ndarray = img_ndarray[np.newaxis, ...]
            else:
                img_ndarray = img_ndarray.transpose((2, 0, 1))

            img_ndarray = img_ndarray / 255

        return img_ndarray

在dataloading.py中除以255是为了让图片转换到（0，1）中
如果是多分类问题,该处就没有任何用处
所以在代码中需要修改

 img = self.preprocess(img, self.scale, is_mask=False)
 mask = self.preprocess(mask, self.scale, is_mask=False)

在train.py中需要修改

              with torch.cuda.amp.autocast(enabled=amp):
                    masks_pred = net(images)
                    loss = criterion(masks_pred, true_masks.squeeze(1)) \
                           + dice_loss(F.softmax(masks_pred, dim=1).float(),
                                       F.one_hot(true_masks.squeeze(1), net.n_classes).permute(0, 3, 1, 2).float(),
                                       multiclass=True)

在 true_masks.squeeze(1) 中加入.squeeze（1）
因为 criterion = nn.CrossEntropyLoss()中的定义如下

输入的predict的维度为（N,C,H,W），对应label输入的维度应该为（N,H,W）,且label的值在[0,C-1]之间。

squeeze的作用看下面的代码

                with torch.cuda.amp.autocast(enabled=amp):
                    masks_pred = net(images)
                    print(masks_pred)
                    print(masks_pred.shape)
                    print(true_masks)
                    print(masks_pred.shape)
                    print(true_masks.squeeze(1))
                    print(true_masks.squeeze(1).shape)
                    loss = criterion(masks_pred, true_masks.squeeze(1)) \
                           + dice_loss(F.softmax(masks_pred, dim=1).float(),
                                       F.one_hot(true_masks.squeeze(1), net.n_classes).permute

最低0.47元/天解锁文章

山河故人938

关注

3
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫