【22-23春】AI作业10-经典卷积网络

本文介绍了几个经典的深度学习模型,包括LeNet与MNIST手写数字识别,AlexNet在CIFAR数据集上的应用,VGGNet的深度结构,GoogLeNet的Inception模块以及ResNet的残差块设计,这些模型都在图像识别和分类任务中展现了优秀性能。
摘要由CSDN通过智能技术生成

1.LeNet & MNIST

LeNet是一种神经网络的模型,用于图像识别和分类。他包含 3 个卷积层,2 个池化层,1 个全连接层。其中所有卷积层的所有卷积核都为 5x5,步长 strid=1,池化方法都为全局 pooling,激活函数为 Sigmoid。

MNIST是一个手写数字识别数据集,包含60000张训练图片和10000张测试图片。图片是单通道灰度图像。MNIST被广泛用于训练和测试机器学习模型的性能。

2. AlexNet & CIFAR

AlexNet是一种深度卷积神经网络的模型,用于图像识别和分类。他包含 8 层,第 1、2、5 层由卷积层和最大池化层构成,其中最大池化层可以降低特征图尺寸和减少网络参数量。第 3 和第 4 层是卷积层,第 6、7、8 层是全连接层,全连接层最后一层是 Softmax 层。AlexNet首次使用了Relu激活函数。
CIFAR是一个包含十个分类的彩色图像数据集,共包含60000张32*32的彩色图像(包含50000张训练图片,10000张测试图片),数据集是三通道的,分别是R,G,B3 个通道被广泛用于训练和测试机器学习模型的性能。

3.VGG Net

VGG Net是一种深度卷积神经网络的模型,用于图像识别和分类。该模型结构非常深,拥有多个卷积层和池化层。VGG Net是由LeNet、Alexnet发展而来的,VGGnet相比于Alex-net而言,具有更小的卷积核,都是3x3的,而Alex-net卷积核较大(11x11,7x7,5x5)。并且相比于AlexNet的3x3的池化核,VGG全部为2x2的池化核。其结构如下图所示:
在这里插入图片描述

4.GoogLeNet & Inception v1

GoogLeNet是一种深度卷积神经网络的模型,用于图像分类和识别。GoogleNet相比VGG,参数量减少了很多,性能表现的更为优越。
Inception v1是该模型的一个版本。它采用一种称为Inception模块的架构,可以在不增加模型参数的同时提高模型性能。

5.ResNet

ResNet是一种深度卷积神经网络的模型,用于图像分类和识别。它采用一种称为残差块的架构,可以避免深度模型训练时出现的梯度消失问题,有助于提高模型性能。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值