AlexNet、ZFNet、VGG、GoogleNet、 ResNet神经网络解析

本文详细解析了AlexNet、ZFNet、VGG、GoogleNet和ResNet等深度学习模型,从2012年AlexNet夺冠ImageNet挑战赛开始,探讨了各模型的结构特点,如AlexNet的ReLU激活、Dropout正则化,VGG的深度优势,以及ResNet的残差结构等,展示了深度神经网络在图像识别领域的进步。
摘要由CSDN通过智能技术生成

1 AlexNet、ZFNet、VGG、GoogleNet、 ResNet神经网络解析

1.1综述

ImageNet大规模视觉识别挑战赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)

  • 计算机视觉领域最具有权威性的学术竞赛之一
  • 由斯坦福大学李飞飞教授主导制作,其中包含了超过1400万张全尺寸的有标记图片
  • ILSVRC从ImageNet数据集中抽取子集作为竞赛数据
    ImageNet大赛历年冠军

1.2AlexNet

AlexNet:2012年ImageNet大规模视觉识别挑战赛冠军,精度提升超过10个百分点。
AlexNet验证了深度卷积神经网络的高效性。
主要贡献:

  • 提出了一种卷积层加全连接层的卷积神经网络结构
  • 首次使用ReLU函数作为神经网络的激活函数
  • 首次提出Dropout正则化来控制过拟合
  • 使用加入动量的小批量梯度下降算法加速了训练过程的收敛
  • 利用了GPU的并行计算能力,加速了网络的训练与推断
    在这里插入图片描述
    在这里插入图片描述
    层数统计说明:
  • 计算网络层数时仅统计卷积层与全连接层
  • 池化层与各种归一化层都是对他们前面卷积层输出的特征图进行后处理,不单独算作一层

AlexNet共8层,5个卷积层和3个全连接层

CONV1

96个11x11卷积核(卷积核的深度由输入图片的深度决定),步长为4,没有零填充。
问题:输入227x227x3大小的图像,输出特征图个数及尺寸为多少?
计算方法见博客
尺寸:(227-11)/4+1=55<

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值