AI 作业 10-经典卷积网络

LeNet & MNIST

LeNet是由Yann LeCun及其合作者于1998年开发的一种具有开创性的卷积神经网络架构。它的设计目的是识别手写数字并执行图像分类任务。MNIST是一个用于手写数字识别的大型数据库,常被用于训练图像处理系统。LeNet与MNIST的关系在于,LeNet经常被用于MNIST数据集的训练和测试。

 

AlexNet & CIFAR

AlexNet是由Alex Krizhevsky,Ilya Sutskever和Geoffrey Hinton在2012年开发的深度卷积神经网络架构。AlexNet包含多个卷积层、池化层、全连接层和激活函数,并引入了Dropout技术以减少过拟合现象。CIFAR是一个包含两个子数据集的图像分类数据库:CIFAR-10和CIFAR-100。尽管AlexNet最初是针对ImageNet数据集开发的,但它的架构和训练方法也可以应用于其他图像分类任务,如CIFAR数据集。

 

VGG Net

VGG Net是一种深度卷积神经网络架构,由Oxford University的Visual Geometry Group(VGG)团队于2014年开发。VGG Net在当年的ImageNet大规模视觉识别挑战(ILSVRC)中取得了优异成绩,以其简洁的结构和卓越的性能获得了广泛关注。VGG Net的核心思想是通过使用较小的卷积核(如3x3)和多个连续卷积层来增加网络深度,从而提高模型的表达能力。VGG Net有多个版本,如VGG-16和VGG-19,这些数字代表网络中包含的权重层(卷积层和全连接层)的数量。

 

GoogLeNet & Inception v1

GoogLeNet是一种深度卷积神经网络架构,由Google的研究人员于2014年开发。GGoogLeNet的核心创新是引入了一种名为Inception的模块结构,因此GoogLeNet有时也被称为Inception v1。Inception模块的主要思想是将多个卷积核大小的卷积层和池化层并行堆叠,从而在不同尺度上捕捉图像特征。具体而言,Inception模块包含1x1、3x3、5x5的卷积层(加入1x1卷积层进行降维以减少计算量)和3x3最大池化层。这些层在同一级别并行操作,然后将它们的输出连接起来,形成一个更丰富的特征表示。

 

ResNet

ResNet(Residual Network)是由Kaiming He, Xiangyu Zhang, Shaoqing Ren和Jian Sun于2015年提出的一种深度卷积神经网络架构。ResNet在2015年的ImageNet大规模视觉识别挑战(ILSVRC)中获得了冠军,同时在分类、定位、检测和分割等任务上取得了前所未有的成绩。ResNet的关键创新是引入残差连接(residual connections)来解决深度神经网络中的梯度消失和退化问题。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值