使用UNet进行图像分割（Pytorch搭建）

最新推荐文章于 2024-05-14 03:03:49 发布

米之炼金术师

最新推荐文章于 2024-05-14 03:03:49 发布

阅读量3.3w

点赞数 83

分类专栏：图像分割深度学习计算机视觉文章标签：深度学习 pytorch 神经网络机器学习

本文链接：https://blog.csdn.net/hehuaiyuyu/article/details/106307748

版权

使用UNet进行图像分割（利用Pytorch搭建）文章目录使用UNet进行图像分割（利用Pytorch搭建）简述环境准备代码数据集模型训练结果简述这里介绍一下如何使用Pytorch搭建一个UNet的图像分割模型，并训练出效果，论文中的一些trick这里没有使用。只包含简单的几个模块，并且大部分代码都有注释。环境平台：Windowspython版本：3.7Pytorch版本：torch：1.3.0，torchvision：0.4.0准备在搭建模型之前，我们还需要做些准备工作，那就是搜集数据

摘要由CSDN通过智能技术生成

使用UNet进行图像分割（利用Pytorch搭建）

文章目录

- 使用UNet进行图像分割（利用Pytorch搭建）
- - 简述
  - 环境
  - 准备
  - 代码
  - - 数据集
    - 模型
    - 训练
  - 结果

简述

这里介绍一下如何使用Pytorch搭建一个UNet的图像分割模型，并训练出效果，论文中的一些trick这里没有使用。

只包含简单的几个模块，并且大部分代码都有注释。

环境

平台：Windows

python版本：3.7

Pytorch版本：torch：1.3.0，torchvision：0.4.0

准备

在搭建模型之前，我们还需要做些准备工作，那就是搜集数据，这里我提供一份眼球毛细血管数据集和一份VOC2012数据集来进行训练，如果有特殊的需求还是要自己搜集数据。

VOC数据集是 PASCAL VOC 挑战赛这个比赛使用的数据，里面包含了目标分类、目标检测、目标分割、姿态识别、行为分类所需要的数据与标签，我这里只使用分割的部分就可以了。

VOC数据集下载地址：

官方： https://pjreddie.com/projects/pascal-voc-dataset-mirror/

或者：https://pan.baidu.com/s/1yfUILB185VvlgQ8bXk536w 提取码：geir

图像样式

原始图片：

标签：

毛细血管数据集下载地址：

https://pan.baidu.com/s/1C06ERcImDpXlTneTrVuXPg 提取码：vmq0

图片样式

原始图片：

标签：

毛细血管数据集与VOC的用法差不多，就只是读取方式有点区别。

代码

总共三个py文件，文件名分别为：dataset（数据集）、unet（网络模型）、train（训练模块）

数据集

下载好数据集之后，解压完毕，可以看到这些文件：

这里我们只使用 JPEGImages 和 SegmentationClass 下的图片来进行语义分割，总共2913张图片。

首先是数据集部分的代码，没有使用数据增强，VOC部分：

import os
import cv2
import torchvision

from torch.utils.data import Dataset
from torchvision.utils import save_image

# 简单的数据集，没有进行数据增强
class Datasets(Dataset):

    def __init__(self, path):
        self.path = path
        # 语义分割需要的图片的加载进来，做标签，总共2913张图片
        self.name = os.listdir(os.path.join(path, "SegmentationClass"))
        self.trans = torchvision.transforms.Compose([torchvision.transforms.ToTensor()])

    def __len__(self):
        return len(self.name)

    # 简单的正方形转换，把图片和标签转为正方形
    # 图片会置于中央，两边会填充为黑色，不会失真
    def __trans__(self, img, size):
        # 图片的宽高
        h, w = img.shape[0:2]
        # 需要的尺寸
        _w = _h = size
        # 不改变图像的宽高比例
        scale = min(_h / h, _w / w)
        h = int(h * scale)
        w = int(w * scale)
        # 缩放图像
        img = cv2.resize(img, (w, h), interpolation=cv2.INTER_CUBIC)
        # 上下左右分别要扩展的像素数
        top = (_h - h) // 2
        left = (_w - w) // 2
        bottom = _h - h - top
        right = _w - w - left
        # 生成一个新的填充过的图像，这里用纯黑色进行填充(0,0,0)
        new_img = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_CONSTANT, value=(0, 0, 0))
        return new_img

    def __getitem__(self, index):
        # 拿到的图片
        name = self.name[index]
        # 把标签名的格式改成jpg，与原始图片一致
        name2jpg = name[:-3] + "jpg"

        # 所有的原始图片和标签
        img_path = [os.path.join(self.path, i) for i in ("JPEGImages", "SegmentationClass")]
        # 读取原始图片和标签，并转RGB
        img_o = cv2.imread(os.path.join(img_path[0], name2jpg))
        img_l = cv2.imread(os.path.join(img_path[1], name))
        img_o = cv2.cvtColor(img_o, cv2.COLOR_BGR2RGB)
        img_l = cv2.cvtColor(img_l, cv2.COLOR_BGR2RGB)

        # 转成网络需要的正方形
        img_o = self.__trans__(img_o,

最低0.47元/天解锁文章

米之炼金术师

关注

83
点赞
踩
594

收藏

觉得还不错? 一键收藏
72
评论
使用UNet进行图像分割（Pytorch搭建）

使用UNet进行图像分割（利用Pytorch搭建）文章目录使用UNet进行图像分割（利用Pytorch搭建）简述环境准备代码数据集模型训练结果简述这里介绍一下如何使用Pytorch搭建一个UNet的图像分割模型，并训练出效果，论文中的一些trick这里没有使用。只包含简单的几个模块，并且大部分代码都有注释。环境平台：Windowspython版本：3.7Pytorch版本：torch：1.3.0，torchvision：0.4.0准备在搭建模型之前，我们还需要做些准备工作，那就是搜集数据
复制链接

扫一扫

专栏目录