ResNet解读和实现

最新推荐文章于 2024-04-22 21:28:03 发布

爱吃鱼的小王同学

最新推荐文章于 2024-04-22 21:28:03 发布

阅读量416

点赞数

分类专栏： FR

本文链接：https://blog.csdn.net/qq_24263553/article/details/106908907

版权

FR 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

ResNet又名残差神经网络，指的是在传统卷积神经网络中加入残差学习（residual learning）的思想，解决了深层网络中梯度弥散和精度下降（训练集）的问题，使网络能够越来越深，既保证了精度，又控制了速度。

随着网络的加深，梯度弥散问题会越来越严重，导致网络很难收敛甚至无法收敛。梯度弥散问题目前有很多的解决办法，包括网络初始标准化，数据标准化以及中间层的标准化（Batch Normalization）等。但是网络加深还会带来另外一个问题：随着网络加深，出现训练集准确率下降的现象
在这里插入图片描述 残差学习的思想：

残差块有两种类型，主要取决于输入输出的维度是否相同，下面我们来看看：
2.2.1 - 恒等块（Identity block）
2.2.2 - 卷积块

构建你的一个残差网络（50层）
在这里插入图片描述 '’

def ResNet50(input_shape=(64,64,3),classes=6):

CONV2D -> BATCHNORM -> RELU -> MAXPOOL -> CONVBLOCK -> IDBLOCK*2 -> CONVBLOCK -> IDBLOCK*3
-> CONVBLOCK -> IDBLOCK*5 -> CONVBLOCK -> IDBLOCK*2 -> AVGPOOL -> TOPLAYER

参数：
    input_shape - 图像数据集的维度
    classes - 整数，分类数
    
返回：
    model - Keras框架的模型
    
"""

#定义tensor类型的输入数据
X_input = Input(input_shape)

#0填充
X = ZeroPadding2D((3,3))(X_input)

#stage1
X = Conv2D(filters=64, kernel_size=(7,7), strides=(2,2), name="conv1",
           kernel_initializer=glorot_uniform(seed=0))(X)
X = BatchNormalization(axis=3, name="bn_conv1")(X)
X = Activation("relu")(X)
X = MaxPooling2D(pool_size=(3,3), strides=(2,2))(X)

#stage2
X = convolutional_block(X, f=3, filters=[64,64,256], stage=2, block="a", s=1)
X = identity_block(X, f=3, filters=[64,64,256], stage=2, block="b")
X = identity_block(X, f=3, filters=[64,64,256], stage=2, block="c")

#stage3
X = convolutional_block(X, f=3, filters=[128,128,512], stage=3, block="a", s=2)
X = identity_block(X, f=3, filters=[128,128,512], stage=3, block="b")
X = identity_block(X, f=3, filters=[128,128,512], stage=3, block="c")
X = identity_block(X, f=3, filters=[128,128,512], stage=3, block="d")

#stage4
X = convolutional_block(X, f=3, filters=[256,256,1024], stage=4, block="a", s=2)
X = identity_block(X, f=3, filters=[256,256,1024], stage=4, block="b")
X = identity_block(X, f=3, filters=[256,256,1024], stage=4, block="c")
X = identity_block(X, f=3, filters=[256,256,1024], stage=4, block="d")
X = identity_block(X, f=3, filters=[256,256,1024], stage=4, block="e")
X = identity_block(X, f=3, filters=[256,256,1024], stage=4, block="f")

#stage5
X = convolutional_block(X, f=3, filters=[512,512,2048], stage=5, block="a", s=2)
X = identity_block(X, f=3, filters=[512,512,2048], stage=5, block="b")
X = identity_block(X, f=3, filters=[512,512,2048], stage=5, block="c")

#均值池化层
X = AveragePooling2D(pool_size=(2,2),padding="same")(X)

#输出层
X = Flatten()(X)
X = Dense(classes, activation="softmax", name="fc"+str(classes),
          kernel_initializer=glorot_uniform(seed=0))(X)


#创建模型
model = Model(inputs=X_input, outputs=X, name="ResNet50")

return model