基于Tensorflow2 和Keras的模型构建及训练过程的几种写法

最新推荐文章于 2024-07-25 21:26:56 发布

今生有幸.~

最新推荐文章于 2024-07-25 21:26:56 发布

阅读量1.2k

点赞数

分类专栏：深度学习基础文章标签： keras tensorflow 深度学习

本文链接：https://blog.csdn.net/For_learning/article/details/121793797

版权

基于Tensorflow2 和Keras的模型构建及训练过程的几种写法

针对深度神经网络，Tensorflow2和Keras提供了丰富的API来构建和训练模型。

本文尝试使用多种方法来构建模型、训练模型。

1. 加载Tensorflow

这里加载了tensorflow和time库，其中tensorflow版本为2.0+。

import tensorflow as tf
import time

2. 加载数据

本文使用CIFAR10数据库来进行实验，并通过tensorflow来加载数据。

其中数据的shape为(None, 32, 32, 3)，(None, 1, 1)。

在训练前，需要对数据进行预处理，主要包括：

图像归一化
标签reshape为(None, 1)
标签onehot编码

(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.cifar10.load_data()

train_images, test_images = train_images / 255.0, test_images / 255.0

train_labels = tf.reshape(train_labels, shape=[train_labels.shape[0]])
test_labels = tf.reshape(test_labels, shape=[test_labels.shape[0]])
train_labels, test_labels = tf.one_hot(train_labels, depth=10), tf.one_hot(test_labels, depth=10)

预处理完后，构建Dataset示例，方便后期训练。

train_dataset = tf.data.Dataset.from_tensor_slices((train_images, train_labels))
train_dataset = train_dataset.shuffle(buffer_size=1024).batch(64)

test_dataset = tf.data.Dataset.from_tensor_slices((test_images, test_labels))
test_dataset = test_dataset.shuffle(buffer_size=1024).batch(64)

3. 构建模型

本文使用一个简单的ResNet结构的模型来进行实验。其中，模型共包括2个Residual Block。具体的模型结构见代码。

下面尝试使用多种方法来构建模型，如：

函数式API
子类化模型
序列化模型

实际应用中，根据具体场景选取合适的构建方式即可。

3.1 函数式API

inputs = tf.keras.Input（shape=(32, 32, 3)）
x = tf.keras.layers.Conv2D(32, 3, padding='same', activation='relu')(inputs)
x = tf.keras.layers.MaxPooling2D()(x)

temp = x
for filter in [64, 128]:
    x = tf.keras.layers.Conv2D(filter, 3, padding='same')(x)
    x = tf.keras.layers.BatchNormalization()(x)
    x = tf.keras.layers.ReLU()(x)
    
	x = tf.keras.layers.Conv2D(filter, 3, padding='same')(x)
    x = tf.keras.layers.BatchNormalization()(x)
    
    res = tf.keras.layers.Conv2D(filter, 1)(temp)
    x = tf.keras.layers.add([x, res])
    
    x = tf.keras.layers.ReLU()(x)
    x = tf.keras.layers.MaxPooling2D()(x)
    
    temp = x

x = tf.keras.layers.GlobalAvgPool2D()(x)
x = tf.keras.layers.Dense(128)