全面小白分析如何使用tensorflow2.0中Model子类化创建自定义模型

本文链接：https://blog.csdn.net/my_name_is_learn/article/details/106787184

在讲清楚如何使用Model子类化创建自定义模型的之前，需要跟大家讲清楚如何使用layers.Layer子类化创建自定义层。通常我们将很多很多层堆叠在一起称之为模型，实际上，一个网络层也是一个模型，只是这个模型很小，就只有一个层而已。所以从本质上，自定义模型层也就是在自定义模型，自定义模型也是在自定义层。

思考一个问题，如何自定义层？本文以实现下面DBL层为例进行自定义层的讲解
在这里插入图片描述
分析上面结构图，我们发现，我们需要卷积层（这个现有），BN层（这个也是现有），Leaky relu层（还是现有）。我们现在使用Sequential的方法来构建这个网络结构。代码如下，注意看代码注释，注意看代码注释，注意看代码注释

from tensorflow.keras import Sequential, layers

# 解决问题：“Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR”，而需要增加下面五条代码
from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession
config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)




# 定义网络结构层
my_name_is_learning_model = Sequential(
    [
        layers.Conv2D(filters=32, kernel_size=3, strides=2, padding='same'),
        layers.BatchNormalization(),
        layers.LeakyReLU(alpha=0.3)
    ]
)

my_name_is_learning_model.build(input_shape=(None, 28, 28, 1))  # 指定网络my_name_is_learning_model的输入形状

import tensorflow as tf

x = tf.Variable(initial_value=tf.random.normal(shape=(32, 28, 28, 1)))  # 随便构造一个数据

out = my_name_is_learning_model(x)  # my_name_is_learning_model就是我们想要的自定义的模型

pass

这样子虽然是可以实现，但是如果你需要用到很多次很多次这样的代码块，每次用到你都需要重复写一次，是不是很繁琐。那有没有我们只写一遍，然后就可以无限调用的呢？还真有。这就是自定义层的由来。

如何自定义层，看下面代码，分析过程写在注释上面，注意看代码注释，注意看代码注释，注意看代码注释。

from tensorflow.keras import Sequential, layers

# 解决问题：“Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR”，而需要增加下面五条代码
from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession

config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)


class DBL(layers.Layer):  # 新定义一个自己想要的类，并且继承这个类tensorflow.keras.layers.Layer

    # 需要重写初始化方法，在这个方法里面堆叠网络结构层
    def __init__(self, alpha, **kwargs):  # 里面可以自己传递想要的参数，这里我只设置了一个参数alpha
        super(DBL, self).__init__(**kwargs)  # 表示继承了夫类的方法，格式如下：super(自定义类名, self).__init__(**kwargs)

        # 开始堆叠网络结构层，这些网络结构层都是之前我们所知道的
        self.layer1 = layers.Conv2D(filters=32, kernel_size=3, strides=2, padding='same')
        self.layer2 = layers.BatchNormalization()
        self.layer3 = layers.LeakyReLU(alpha=alpha)

    def call(self, inputs, **kwargs):  # 使用call方法来定义网络数据的正向传播
        x1 = self.layer1(inputs)  # 格式 输出 = 网络层（输入）
        x2 = self.layer2(x1)
        x3 = self.layer3(x2)

        return x3  # 返回输出


# 如何使用自定义层
# 第一步，实例化自定义层的类
my_name_is_learning_model = DBL(alpha=0.3)
import tensorflow as tf

x = tf.Variable(initial_value=tf.random.normal(shape=(32, 28, 28, 1)))  # 随便构造一个数据

out = my_name_is_learning_model(x)  # my_name_is_learning_model就是我们想要的自定义的层

# 以后我们想要使用的时候，实例化之后就可以调用了。
pass

自定义之后，如果我们想要构建拥有三个DBL结构的神经网络，我们该如何构建？我们使用函数式API的方式进行构建，超级简单，看下面代码，分析过程写在注释上面，注意看代码注释，注意看代码注释，注意看代码注释。

from tensorflow.keras import Sequential, layers, models

# 解决问题：“Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR”，而需要增加下面五条代码
from tensorflow.compat.v1 import ConfigProto
from tensorflow.compat.v1 import InteractiveSession

config = ConfigProto()
config.gpu_options.allow_growth = True
session = InteractiveSession(config=config)


class DBL(layers.Layer):  # 新定义一个自己想要的类，并且继承这个类tensorflow.keras.layers.Layer

    # 需要重写初始化方法，在这个方法里面堆叠网络结构层
    def __init__(self, alpha, **kwargs):  # 里面可以自己传递想要的参数，这里我只设置了一个参数alpha
        super(DBL, self).__init__(**kwargs)  # 表示继承了夫类的方法，格式如下：super(自定义类名, self).__init__(**kwargs)

        # 开始堆叠网络结构层，这些网络结构层都是之前我们所知道的
        self.layer1 = layers.Conv2D(filters=32, kernel_size=3, strides=2, padding='same')
        self.layer2 = layers.BatchNormalization()
        self.layer3 = layers.LeakyReLU(alpha=alpha)

    def call(self, inputs, **kwargs):  # 使用call方法来定义网络数据的正向传播
        x1 = self.layer1(inputs)  # 格式 输出 = 网络层（输入）
        x2 = self.layer2(x1)
        x3 = self.layer3(x2)

        return x3  # 返回输出


def sangeDBL():
    input_img = layers.Input(shape=(28, 28, 1))  # 定义输入尺寸，input_img为（None, 28, 28, 1)

    x1 = DBL(alpha=0.1)(input_img)  # 格式：输出 = 实例对象（输入）
    x2 = DBL(alpha=0.1)(x1)  # 格式：输出 = 实例对象（输入）
    x3 = DBL(alpha=0.1)(x2)  # 格式：输出 = 实例对象（输入）

    model = models.Model(inputs=input_img, outputs=x3)  # 定义输入输出
    return model


# 使用sangeBDL模型
import tensorflow as tf

x = tf.Variable(initial_value=tf.random.normal(shape=(32, 28, 28, 1)))  # 随便构造一个数据

model = sangeDBL()  # 调用函数，返回一个模型对象
out = model(x)  # 调用一次模型进行输出
pass