深度学习（05）--典型CNN结构（VGG13,16,19）

最新推荐文章于 2024-05-03 20:59:02 发布

Zero-One-0101

最新推荐文章于 2024-05-03 20:59:02 发布

阅读量6.3k

点赞数 1

分类专栏： ML&DL-深度学习文章标签：深度学习

本文链接：https://blog.csdn.net/wangzi11111111/article/details/88945908

版权

ML&DL-深度学习专栏收录该内容

19 篇文章 0 订阅

订阅专栏

文章目录

在这里插入图片描述

 LeNet5用大的卷积核来获取图像的相似特征
 AlexNet用99、1111的滤波器
 VGG 巨大的进展是通过依次采用多个 3×3 卷积，模仿出更大的感受野（receptive field）效果，例如 5×5 与 7×7。
 这些思想也被用在更多的网络架构中，如 Inception 与 ResNet。

VGG16的效果最好

在这里插入图片描述

VGG16 的第 3、4、5 块（block）：256、512、512个 3×3 滤波器依次用来提取复杂的特征。
其效果就等于是一个带有 3 个卷积层的大型的 512×512 大分类器。

2.VGG结构解释

(1)VGG全部使用33卷积核、22池化核，不断加深网络结构来提升性能。
(2)A到E网络变深，参数量没有增长很多，参数量主要在3个全连接层。
(3)训练比较耗时的依然是卷积层，因计算量比较大。
(4)VGG有5段卷积，每段有2~3个卷积层，每段尾部用池化来缩小图片尺寸。
(5)每段内卷积核数一样，越靠后的段卷积核数越多：64–128–256–512–512。

3.3*3卷积核的优点

在这里插入图片描述

4.VGG的muti-scale方法

在这里插入图片描述

LRN层作用不大。
越深的网络效果越好。
11的卷积也是很有效的，但是没有33的卷积好
大的卷积核可以学习更大的空间特征

1*1的卷积的作用
1.实现跨通道的交互和信息整合

1×1的卷积层（可能）引起人们的重视是在NIN的结构中，论文中林敏师兄的想法是利用MLP代替传统的线性卷积核，从而提高网络的表达能力。文中同时利用了跨通道pooling的角度解释，认为文中提出的MLP其实等价于在传统卷积核后面接cccp层，从而实现多个feature map的线性组合，实现跨通道的信息整合。

2.进行卷积核通道数的降维

降维（ dimension reductionality ）。比如，一张500 X500且厚度depth为100 的图片在20个filter上做1X1的卷积，那么结果的大小为500X500X20。
加入非线性。卷积层之后经过激励层，1X1的卷积在前一层的学习表示上添加了非线性激励（ non-linear activation ），提升网络的表达能力；

5.VGG的应用

VGG9、VGG11、VGG13、VGG16、VGG19

出现了梯度消失的问题
只在第一个卷积（name=’block1_conv1’）后面加了BatchNormalization就解决了

def VGG16(input_shape=(64,64,3), classes=6):

    X_input = Input(input_shape)

    "block 1"
    X = Conv2D(filters=4, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block1_conv1')(X_input)
    X = BatchNormalization(axis=3)(X)
    X = Conv2D(filters=4, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block1_conv2')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='block1_pool')(X)

    "block 2"
    X = Conv2D(filters=8, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block2_conv1')(X)
    X = BatchNormalization(axis=3)(X)
    X = Conv2D(filters=8, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block2_conv2')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='block2_pool')(X)

    "block 3"
    X = Conv2D(filters=16, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block3_conv1')(X)
    X = Conv2D(filters=16, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block3_conv2')(X)
    X = Conv2D(filters=16, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block3_conv3')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='block3_pool')(X)

    "block 4"
    X = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block4_conv1')(X)
    X = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block4_conv2')(X)
    X = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block4_conv3')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='block4_pool')(X)

    "block 5"
    X = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block5_conv1')(X)
    X = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block5_conv2')(X)
    X = Conv2D(filters=32, kernel_size=(3,3), strides=(1,1), activation='relu', padding='same', name='block5_conv3')(X)
    X = MaxPooling2D((2,2), strides=(2,2), name='block5_pool')(X)

    "flatten, fc1, fc2, fc3"
    X = Flatten(name='flatten')(X)
    X = Dense(256,    activation='relu',    name='fc1')(X)
    X = Dense(256,    activation='relu',    name='fc2')(X)
    X = Dense(classes, activation='softmax', name='fc3')(X)

    model = Model(inputs=X_input, outputs=X, name='VGG16')

    return model

Zero-One-0101

关注

1
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
深度学习（05）--典型CNN结构（VGG13,16,19）

文章目录目录1.VGG结构2.VGG结构解释3.3*3卷积核的优点4.VGG的muti-scale方法5.VGG的应用目录1.VGG结构 LeNet5用大的卷积核来获取图像的相似特征 AlexNet用99、1111的滤波器 VGG 巨大的进展是通过依次采用多个 3×3 卷积，模仿出更大的感受野（receptive field）效果，例如 5×5 与 7×7。 这些思想也被用...
复制链接

扫一扫