通过FCN模型实现图像分割（Python篇+代码）

CleloGauss

已于 2024-07-11 11:37:21 修改

阅读量3.5k

点赞数 12

文章标签： python 深度学习计算机视觉

于 2023-05-19 16:57:45 首次发布

本文链接：https://blog.csdn.net/weixin_48685040/article/details/130123050

版权

基于深度学习的图像分割方法

深度学习是在超声图像分割中非常实用的方法，它的主要优点是能够生成由丰富语义和细微信息组成的多层次特征。将深度学习网络应用到甲状腺检测中，可以准确、快速的定位并对结节和实质区域进行精准勾画。

使用深度神经网络的原因是神经网络是一种多层的、可训练的模型，这样的话，它就能对图像中的甲状腺结点起到分类效果，且通过一定量的正则化训练，神经网络的性能也将愈加优异，对图像的分类也更加精准。

为了对甲状腺结节进行更加精确的分割，有人提出了全卷积神经网络（FCN），将经典卷积神经网络CNN末尾的全连接层用卷积层代替，使得整个网络主要包括卷积层和池化层，对不同采样率的空洞卷积的特征图进行采样融合，从而起到分割效果，下面我将介绍如何通过FCN模型实现图像分割。

FCN模型实现图像分割的流程

注：我这里是用pycharm来编写和运行程序的，然后解释器选择的是Conda3，需要的库，如CV之类的，你们看着安装，学会第一个，其他的应该很快就能成功.

一、模型的构建：

模型的构建的一个关键就是用到了tensorflow库，没有安装的小伙伴可以看我之前的文章，可以通过里面的函数，定义模型的输入层、卷积层、池化层、反卷积层、输出层，经过各个步骤，模型就能构建出来，这里有一个地方得非常注意，输出层的activation函数千万别选softmax，一定要选sigmoid，别问我为什么知道。

二、数据集的预处理：

我获取到的数据集是由图像和掩膜两部分组成，数据集的处理就是将掩膜（灰度为白255和黑0）映射为前景（1）和背景（0）的标签，将标签转换成单通道，同时将图像转换为RGB、进行 min-max 归一化，并将它们转换为两个numpy数组。

三、构建模型、编译模型、训练模型：

在这之中，我们需要特别关注的是模型的编译以及模型的训练，在模型的编译之中，我们得选取合适的优化器，这里我通过多次测试，发现选择使用Adam优化器效果最好，然后是选择学习率，学习率过小->收敛过慢；学习率过大->错过局部最优，我选择0.001，损失函数选择二元交叉熵（binary_crossentropy），以准确率（accuracy）作为评价指标。

在模型的训练中，可以定义一个监测器，当训练迭代5次的loss都不再减小时，那么就说明训练的模型基本上已经达到当前的最优模型，需要停止训练，输入的参数就是图像、标签、迭代次数、验证集（不能和测试集一样，可以将部分的数据集分离出来定义成验证集，其他的归为测试集）、以及callbacks监视器。

最后，记得保存训练后的模型，毕竟训练一次非常耗时。

训练模型的代码：

import tensorflow as tf
import cv2
import numpy as np
import os
from keras.optimizers import Adam

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'


# 构建FCN模型
def fcn_model(input_shape, num_classes):
    # 定义输入层
    inputs = tf.keras.layers.Input(shape=input_shape)

    # 定义卷积层
    conv1 = tf.keras.layers.Conv2D(32, (3, 3), activation='relu', padding='same')(inputs)
    conv2 = tf.keras.layers.Conv2D(32, (3, 3), activation='relu', padding='same')(conv1)

    # 定义池化层
    pool1 = tf.keras.layers.MaxPooling2D((2, 2))(conv2)

    # 定义更深的卷积层和池化层
    conv3 = tf.keras.layers.Conv2D(64, (3, 3), activation='relu', padding='same')(pool1)
    conv4 = tf.keras.layers.Conv2D(64, (3, 3), activation='relu', padding='same')(conv3)
    pool2 = tf.keras.layers.MaxPooling2D((2, 2))