tensorflow常用构造深度学习模型的两种方式

Shell-We

已于 2022-06-17 19:41:02 修改

阅读量695

点赞数 3

分类专栏：深度学习文章标签： tensorflow 深度学习

于 2021-05-25 15:33:34 首次发布

本文链接：https://blog.csdn.net/ProgrammersFighting/article/details/117251225

版权

深度学习专栏收录该内容

8 篇文章

订阅专栏

tensorflow常用构造深度学习模型的两种方式

一、引言

tensorflow常用构造模型的方式有两种:

1、Sequential()方式
2、函数式API

二、Sequtial()方式

2.1 向Sequential()中传递layer列表

示例一：

model = Sequential([Dense(64, input_shape=(784, ), activation='relu'),  # 添加第一层隐藏层，输入维度为(784, )
                    Dropout(0.2),
                    Dense(64, activation='relu'),                       # 添加第二层隐藏层
                    Dropout(0.2),
                    Dense(10, activation='softmax')                     # 添加输出层
                    ])

示例二：

model = Sequential([Dense(64, input_shape=(784, )),   # 添加第一层隐藏层
                    Activation('relu'),
                    Dropout(0.2),
                    Dense(64),                        # 添加第二层隐藏层
                    Dropout(0.2),
                    Dense(10),                        # 添加第三层隐藏
                    Activation('softmax')])

2.2 利用model.add()方法添加layer

示例一：

model = Sequential()       # 实例化顺序模型
model.add(Dense(64, input_shape=(784, ), activation='relu'))   # 添加第一层隐藏层
model.add(Dropout(0.2))
model.add(Dense(64, activation='relu'))     # 添加第二层隐藏层
model.add(Dropout(0.2))
model.add(Dense(10, activation='softmax'))  # 添加输出层

示例二：

model = Sequential()
model.add(Dense(64, input_shape=(784, )))  # 添加第一层隐藏层
model.add(Activation('relu'))
model.add(Dropout(0.2))
model.add(Dense(64))
model.add(Activation('relu'))              # 添加第二层隐藏层
model.add(Dropout(0.2))
model.add(Dense(10))                       # 添加第三层隐藏层
model.add(Activation('softmax'))

三、函数式API

示例一：

inputs = keras.Input(shape=(784,), name='mnist_input')
h1 = Dense(64, activation='relu')(inputs)     # 过第一个隐藏层
h1 = Dropout(0.2)(h1)
h1 = Dense(64, activation='relu')(h1)         # 过第二个隐藏层
h1 = Dropout(0.2)(h1)
outputs = Dense(10, activation='softmax')(h1) # 过第三个隐藏层
model = keras.Model(inputs, outputs)

示例二：

inputs = keras.Input(shape=(784,), name='mnist_input')
h1 = Dense(64)(inputs)
h1 = Activation('relu')(h1)
h1 = Dropout(0.2)(h1)
h1 = Dense(64)(h1)
h1 = Activation('relu')(h1)
h1 = Dropout(0.2)(h1)
outputs = Dense(10)(h1)
outputs = Activation('softmax')(outputs)
model = keras.Model(inputs, outputs)

备注：采用函数式API可以将构建的模型封装为函数或者类

四、栗子-手写体数字识别

######################导入相应的模块###########################
from tensorflow import keras
from tensorflow.keras.layers import Dense, Activation, Dropout
from tensorflow.keras import Sequential
import matplotlib.pyplot as plt

##########################数据准备#############################
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()   #加载mnist数据集
x_train = x_train.reshape(60000, 784).astype('float32') /255    # 对图片像素做归一化处理
x_test = x_test.reshape(10000, 784).astype('float32') /255     # 对图片像素做归一化处理
x_val = x_train[-10000:]     # 划分训练集与校验集
y_val = y_train[-10000:]
x_train = x_train[:-10000]   # 划分训练集与校验集
y_train = y_train[:-10000]

######################模型构建###########################
# Sequential()方式
# model = Sequential()       # 实例化顺序模型
# model.add(Dense(64, input_shape=(784, ), activation='relu'))   # 添加第一层隐藏层
# model.add(Dropout(0.2))
# model.add(Dense(64, activation='relu'))     # 添加第二层隐藏层
# model.add(Dropout(0.2))
# model.add(Dense(10, activation='softmax'))  # 添加输出层

# 函数式API
inputs = keras.Input(shape=(784,), name='mnist_input')
h1 = Dense(64, activation='relu')(inputs)     # 过第一个隐藏层
h1 = Dropout(0.2)(h1)
h1 = Dense(64, activation='relu')(h1)         # 过第二个隐藏层
h1 = Dropout(0.2)(h1)
outputs = Dense(10, activation='softmax')(h1) # 过第三个隐藏层
model = keras.Model(inputs, outputs)

######################编译模型###########################
model.compile(optimizer=keras.optimizers.RMSprop(),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=['accuracy'])

######################模型训练###########################
history = model.fit(x_train, 
					y_train, 
					batch_size=64, 
					epochs=3,
					validation_data=(x_val, y_val))

######################模型训练###########################
history = model.fit(x_train, y_train, batch_size=64, epochs=30,
         validation_data=(x_val, y_val))
         
######################模型评估###########################
result = model.evaluate(x_test, y_test, batch_size=128)

######################模型预测###########################
pred = model.predict(x_test[:2])

#######################损失可视化###########################
trian_loss = history.history['loss']
val_loss = history.history['val_loss']
plt.plot(trian_loss, label='train_loss')
plt.plot(val_loss, label='val_loss')
plt.xlabel('epochs')
plt.ylabel('loss')
plt.legend()
plt.show()