使用keras进行迁移学习
概述
针对小型数据集,如果从头训练一个网络效果并不理想,如何进一步提高呢?在上一篇博文的基础上,我们进行预训练。即用迁移学习的思想来提高分类效果。
使用预训练的方法有两种:特征提取和模型微调
提取特征法
提取特征这法又分为两种形式,一种是用之前预训练过的网络直接提取特征然后将这些特征送入新的分类器从头开始训练
这里我们使用VGG16作为预训练模型,先实例化resnet50:
from keras.applications import VGG16
image_size = 200
conv_base = VGG16(weights='imagenet',
include_top=False,
input_shape=(image_size, image_size, 3)
)
conv_base.summary
其中weights指定了模型初始化的权重检查点。include_top指的是加载模型最后是否连接分类器。迁移学习时候选False。 input_shape是输入图片的形状,不选的为任意输入。(这里需要定义的)conv_base.summary 可以看具体数据,我们重点看最后一层,它决定输出的形状
不数据增强的特征提取
首先第一步,对train、test和validation三个数据集进行特征提取,这里我们知道最后一层是[none,7,7,2048],那么么一个样本输出的特征都是[7,7,2048]
Last_Layer = [7,7,2048]
base_dir = './cats_and_dogs_small'
train_dir = os.path.join(base_dir, 'train')
validation_dir = os.path.join(base_dir, 'validation')
test_dir = os.path.join(base_dir, 'test')
datagen = ImageDataGenerator(rescale=1./255)
batch_size = 20
def extract_features(directory, sample_count):
features = np.zeros(shape=(sample_count, Last_Layer[0],Last_Layer[1],Last_Layer[2]))
labels = np.zeros(shape=(sample_count))
generator = datagen.flow_from_directory(
directory,
target_size=(image_size, image_size),
batch_size=batch_size,
class_mode='binary')
i = 0
for inputs_batch, labels_batch in generator:
features_batch