图像分割实战-系列教程3：unet医学细胞分割实战1（医学数据集、图像分割、语义分割、unet网络、代码逐行解读）

机器学习杨卓越

已于 2024-01-01 23:21:33 修改

阅读量3.3k

点赞数 13

分类专栏：图像分割实战文章标签：计算机视觉图像分割 unet

于 2023-12-30 23:34:21 首次发布

本文链接：https://blog.csdn.net/weixin_50592077/article/details/135311290

版权

图像分割实战专栏收录该内容

19 篇文章 10 订阅

订阅专栏

🍁🍁🍁图像分割实战-系列教程总目录

有任何问题欢迎在下面留言
本篇文章的代码运行界面均在Pycharm中进行
本篇文章配套的代码资源已经上传

unet医学细胞分割实战1
unet医学细胞分割实战2
unet医学细胞分割实战3
unet医学细胞分割实战4
unet医学细胞分割实战5
unet医学细胞分割实战6

1、医学细胞数据集介绍

1.1 数据集

如图所示，右图就是原始数据，而左边就是标签，一共670条训练数据

1.2 原始数据集预处理

上面的数据是经过处理的，实际上的原始数据是在Kaggle上下载的公开数据集

是包含的一个一个的文件夹，每个文件夹中分别是数据和标签

而标签中是细胞图像中，对每一个细胞都做成了标签，分成了很多张小图片，我们首先要做的是把这些小图片拼到一起

import os
from glob import glob
import cv2
import numpy as np
from tqdm import tqdm 
img_size = 96
paths = glob('inputs/stage1_train/*')
os.makedirs('inputs/dsb2018_%d/images' % img_size, exist_ok=True)
os.makedirs('inputs/dsb2018_%d/masks/0' % img_size, exist_ok=True)
for i in tqdm(range(len(paths))):
    path = paths[i]
    img = cv2.imread(os.path.join(path, 'images',
                     os.path.basename(path) + '.png'))
    mask = np.zeros((img.shape[0], img.shape[1]))
    for mask_path in glob(os.path.join(path, 'masks', '*')):
        mask_ = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE) > 127
        mask[mask_] = 1
    if len(img.shape) == 2:
        img = np.tile(img[..., None], (1, 1, 3))
    if img.shape[2] == 4:
        img = img[..., :3]
    img = cv2.resize(img, (img_size, img_size))
    mask = cv2.resize(mask, (img_size, img_size))
    cv2.imwrite(os.path.join('inputs/dsb2018_%d/images' % img_size,
                os.path.basename(path) + '.png'), img)
    cv2.imwrite(os.path.join('inputs/dsb2018_%d/masks/0' % img_size,
                os.path.basename(path) + '.png'), (mask * 255).astype('uint8'))

这部分代码只需要把那些小图片按照顺序汇总，使用OpenCV拼在一起就可以了，然后所有的数据都是这样的处理方式，最后会得到1.1形式的数据集，这里就不演示以及解释代码了，如果对OpenCV不熟悉的可以参数这篇教程

2、训练参数解读

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('--name', default=None, help='model name: (default: arch+timestamp)')
    parser.add_argument('--epochs', default=100, type=int, metavar='N', help='number of total epochs to run')
    parser.add_argument('-b', '--batch_size', default=8, type=int, metavar='N', help='mini-batch size (default: 16)')
    parser.add_argument('--arch', '-a', metavar='ARCH', default='NestedUNet', choices=ARCH_NAMES, help='model architecture: ' +
                        ' | '.join(ARCH_NAMES) + ' (default: NestedUNet)')
    parser.add_argument('--deep_supervision', default=False, type=str2bool)
    parser.add_argument('--input_channels', default=3, type=int, help='input channels')
    parser.add_argument('--num_classes', default=1, type=int, help='number of classes')
    parser.add_argument('--input_w', default=96, type=int, help='image width')
    parser.add_argument('--input_h', default=96, type=int, help='image height')
    parser.add_argument('--loss', default='BCEDiceLoss', choices=LOSS_NAMES, help='loss: ' +
                        ' | '.join(LOSS_NAMES) + ' (default: BCEDiceLoss)')
    parser.add_argument('--dataset', default='dsb2018_96', help='dataset name')
    parser.add_argument('--img_ext', default='.png', help='image file extension')
    parser.add_argument('--mask_ext', default='.png', help='mask file extension')
    parser.add_argument('--optimizer', default='SGD', choices=['Adam', 'SGD'], help='loss: ' +
                        ' | '.join(['Adam', 'SGD']) + ' (default: Adam)')
    parser.add_argument('--lr', '--learning_rate', default=1e-3, type=float, metavar='LR', help='initial learning rate')
    parser.add_argument('--momentum', default=0.9, type=float, help='momentum')
    parser.add_argument('--weight_decay', default=1e-4, type=float, help='weight decay')
    parser.add_argument('--nesterov', default=False, type=str2bool, help='nesterov')
    parser.add_argument('--scheduler', default='CosineAnnealingLR',
                        choices=['CosineAnnealingLR', 'ReduceLROnPlateau', 'MultiStepLR', 'ConstantLR'])
    parser.add_argument('--min_lr', default=1e-5, type=float,
                        help='minimum learning rate')
    parser.add_argument('--factor', default=0.1, type=float)
    parser.add_argument('--patience', default=2, type=int)
    parser.add_argument('--milestones', default='1,2', type=str)
    parser.add_argument('--gamma', default=2/3, type=float)
    parser.add_argument('--early_stopping', default=-1, type=int,
                        metavar='N', help='early stopping (default: -1)')
    
    parser.add_argument('--num_workers', default=0, type=int)

    config = parser.parse_args()

    return config

参数函数
参数实例化对象
指定网络的名字（Unet++）
训练epochs，数据很小，h和w很小、量也小，100轮够了，20分钟就能跑完
batch_size根据自己显卡资源指定
网络架构，在后面部分会解释
是否需要在每个位置都加上监督
输入通道数
类别个数，当前任务比较简单，只有是细胞和不是细胞
输入图像H
输入图像W
指定损失函数为交叉熵
数据集名字
图像文件的扩展名
掩码文件的扩展名
优化器SGD
学习率
动量加速
学习率衰减
使用了一个自定义的类型转换函数 str2bool 来处理输入值，这个函数为：

def str2bool(v):
    if v.lower() in ['true', 1]:
        return True
    elif v.lower() in ['false', 0]:
        return False
    else:
        raise argparse.ArgumentTypeError('Boolean value expected.')

scheduler，指定使用默认值为 'CosineAnnealingLR’为学习率调度器
最小学习率
factor，指定在特定条件下调整学习率时的乘法因子，默认值为0.1
patience，对于一些调度器（如 ReduceLROnPlateau），这个参数定义了在性能不再提升时要等待多少周期之后才减少学习率。默认值为 2。类型为 int。
milestones，对于 MultiStepLR 调度器，这个参数定义了何时降低学习率的周期数。默认值是 ‘1,2’（表示一个字符串，您可能需要在代码中将其分割为多个数值）。类型为 str。
gamma值
设置提前停止
用于指定在数据加载时用于数据预处理的进程数。

3、指定训练参数

"""
指定参数：
--dataset dsb2018_96 
--arch NestedUNet
"""

指定数据集和网络架构的参数后，执行train.py

unet医学细胞分割实战1
unet医学细胞分割实战2
unet医学细胞分割实战3
unet医学细胞分割实战4
unet医学细胞分割实战5
unet医学细胞分割实战6

机器学习杨卓越

关注

13
点赞
踩
35

收藏

觉得还不错? 一键收藏
打赏
11
评论
图像分割实战-系列教程3：unet医学细胞分割实战1（医学数据集、图像分割、语义分割、unet网络、代码逐行解读）

图像分割实战-系列教程3：unet医学细胞分割实战（医学数据集、图像分割、语义分割、unet网络、代码逐行解读）
复制链接

扫一扫