自定义模型：tf.keras.Model 和 tf.keras.layers 的使用

最新推荐文章于 2025-04-15 21:28:39 发布

一碗黄焖鸡三碗米饭

最新推荐文章于 2025-04-15 21:28:39 发布

阅读量1.1k

点赞数 9

分类专栏：人工智能前沿与实践文章标签： keras 人工智能深度学习 tensorflow 机器学习 python ai

本文链接：https://blog.csdn.net/sjdgehi/article/details/146376135

版权

自定义模型：tf.keras.Model 和 tf.keras.layers 的使用

在深度学习中，模型的构建和设计是核心工作之一。TensorFlow 提供了高层 API tf.keras，它使得模型的构建变得更加简便和高效。通过使用 tf.keras.Model 和 tf.keras.layers，我们可以快速搭建神经网络模型，并根据自己的需求自定义模型的结构。今天，我们将深入探讨如何使用这两个核心类来构建自定义模型。

本文将详细讲解 tf.keras.Model 和 tf.keras.layers 的使用，并通过代码示例深入探讨它们的实际应用，帮助你更好地理解 TensorFlow 中的模型构建流程。

1. tf.keras.Model

tf.keras.Model 是 TensorFlow 中定义神经网络模型的核心类之一。它为我们提供了很多方便的方法来管理模型的构建、训练、评估等任务。通过继承 tf.keras.Model，我们可以定义一个全新的模型类，并实现自己特定的前向传播逻辑。

1.1 定义自定义模型

首先，我们来看一个简单的例子，展示如何通过继承 tf.keras.Model 来创建一个自定义模型。

示例代码：自定义模型

import tensorflow as tf

# 定义一个简单的自定义模型
class MyModel(tf.keras.Model):
    def __init__(self):
        super(MyModel, self).__init__()
        # 定义层
        self.dense1 = tf.keras.layers.Dense(128, activation='relu')
        self.dense2 = tf.keras.layers.Dense(64, activation='relu')
        self.output_layer = tf.keras.layers.Dense(10, activation='softmax')

    def call(self, inputs):
        # 定义前向传播
        x = self.dense1(inputs)
        x = self.dense2(x)
        return self.output_layer(x)

# 创建模型实例
model = MyModel()

# 打印模型摘要
model.build(input_shape=(None, 784))  # 假设输入数据为28x28的图像展平后形成的向量
model.summary()

代码解析：

通过继承 tf.keras.Model，我们可以自定义自己的神经网络模型类。
在 __init__ 方法中定义网络的各个层，通常使用 tf.keras.layers 提供的层（如 Dense、Conv2D 等）。
call 方法定义了前向传播的计算逻辑，它描述了数据是如何通过各个层进行传递和变换的。

输出：

Model: "my_model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 dense (Dense)               (None, 128)