网络介绍请参看:博文
keras搭建深度学习模型的若干方法:博文
迁移学习
import tensorflow as tf
from tensorflow import keras
base_model = keras.applications.DenseNet121(weights='imagenet')
base_model.summary()
Dense block 结构剖析
整个网络的关键就是Dense block
以第一个Dense Block为例,示意图如下。即每一卷积组(第一个表中的1x1 和 3x3)最后卷积操作(特征层数相同)的特征输出,将与网络后的卷积组特征层进行堆叠。
同时我们观察迁移学习得到的summary对比一下是否符合示意图的特征层堆叠形式。
以下是DenseNet121第一个block的完整结构,其中包括了6组卷积。
绿色方框表示一个卷积组操作,红色方框表示特征层的堆叠,可见每一个卷积组的最后特征层数相同都是32,然后与上一个卷积组的输出进行堆叠,就这样网络特征层不断增加。
自编代码
导入各种库
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models, Sequential, backend
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dense, Flatten, Dropout, BatchNormalization, Activation, GlobalAveragePooling2D
from tensorflow.keras.layers import Concatenate, Lambda, Input, ZeroPadding2D, AveragePooling2D
卷积组(1x1+3x3)
首先定义网络中的最小单元一个卷积组,即1x1+3x3卷积操作。
每一个卷积操作配套bn+relu+conv2d
def conv_block(x, nb_filter, dropout_rate=None, name=None):
inter_channel = nb_filter*4
# 1x1 convolution
x = BatchNormalization(epsilon=1.1e-5, axis=3, name=name+'_bn1')(x)
x = Activation('relu', name=name+'_relu1')(x)
x = Conv2D(inter_channel, 1, 1, name=name+