序贯模型Sequential
特点:“一条路走到黑”,多个网络层的线性堆叠。
通过向Sequential模型传递一个layer的list来构造该模型,如以下代码所示:
from keras.models import Sequential
from keras.layers import Dense, Activation
model = Sequential([
Dense(32, units=784),
Activation('relu'),
Dense(10),
Activation('softmax'),
])
也可以通过.add()将layer加入模型中:
model = Sequential()
model.add(Dense(32, input_shape=(784,)))
model.add(Activation('relu'))
模型需要知道输入数据的shape,因此,第一层需要设置一个输入数据shape的参数,方法如下:
- 传递一个input_shape的关键字参数给第一层,是一个tuple类型的数据。数据的batch大小不应包含在其中。
- 有些2D层,如Dense,支持通过指定input_dim来隐含的指定输入数据的shape,是一个int类型的数据。
- 有些3D层,支持通过指定input_dim和input_length来指定输入数据的shape。
- 如果需要为输入指定一个固定大小的batch_size(常用于stateful RNN网络),可以传递
batch_size
参数到一个层中,例如我们想指定输入张量的batch大小是32,数据shape是(6,8),则你需要传递batch_size=32
和input_shape=(6,8)。
如以下代码:
model = Sequential()
model.add(Dense(32, input_dim=784))
model = Sequential()
model.add(Dense(32, input_shape=(784,)))
编译
在训练模型之前,需要进行compile编译。compile接受三个参数:
- 优化器optimizer:该参数可以设置为已经定义好的优化器名,如rmsprop、adagrad或者一个Optimizer类的对象。
- 损失函数loss:该参数为模型试图最小化的目标函数。
- 指标列表metrics:对于分类问题,我们一般将该列表设置为metrics=['accuracy']。
如以下代码:
# For a multi-class classification problem
model.compile(optimizer='rmsprop',
loss='categorical_crossentropy',
metrics=['accuracy'])
# For a binary classification problem
model.compile(optimizer='rmsprop',
loss='binary_crossentropy',
metrics=['accuracy'])
# For a mean squared error regression problem
model.compile(optimizer='rmsprop',
loss='mse')
# For custom metrics
import keras.backend as K
def mean_pred(y_true, y_pred):
return K.mean(y_pred)
model.compile(optimizer='rmsprop',
loss='binary_crossentropy',
metrics=['accuracy', mean_pred])
训练
Keras以Numpy数组作为输入数据和标签的数据类型。训练模型一般使用fit函数。详见以下例子:
# For a single-input model with 2 classes (binary classification):
model = Sequential()
model.add(Dense(32, activation='relu', input_dim=100))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop',
loss='binary_crossentropy',
metrics=['accuracy'])
# Generate dummy data
import numpy as np
data = np.random.random((1000, 100))
labels = np.random.randint(2, size=(1000, 1))
# Train the model, iterating on the data in batches of 32 samples
model.fit(data, labels, epochs=10, batch_size=32)