【22-23春】AI作业10-经典卷积网络

最新推荐文章于 2024-09-14 16:43:45 发布

是锦鲤本臾了!

最新推荐文章于 2024-09-14 16:43:45 发布

阅读量580

点赞数 1

文章标签：人工智能网络深度学习

本文链接：https://blog.csdn.net/qq_17019229/article/details/130838379

版权

本文介绍了几个经典的深度学习模型，包括LeNet与MNIST手写数字识别，AlexNet在CIFAR数据集上的应用，VGGNet的深度结构，GoogLeNet的Inception模块以及ResNet的残差块设计，这些模型都在图像识别和分类任务中展现了优秀性能。

摘要由CSDN通过智能技术生成

1.LeNet & MNIST

LeNet是一种神经网络的模型，用于图像识别和分类。他包含 3 个卷积层，2 个池化层，1 个全连接层。其中所有卷积层的所有卷积核都为 5x5，步长 strid=1，池化方法都为全局 pooling，激活函数为 Sigmoid。

MNIST是一个手写数字识别数据集，包含60000张训练图片和10000张测试图片。图片是单通道灰度图像。MNIST被广泛用于训练和测试机器学习模型的性能。

2. AlexNet & CIFAR

AlexNet是一种深度卷积神经网络的模型，用于图像识别和分类。他包含 8 层，第 1、2、5 层由卷积层和最大池化层构成，其中最大池化层可以降低特征图尺寸和减少网络参数量。第 3 和第 4 层是卷积层，第 6、7、8 层是全连接层，全连接层最后一层是 Softmax 层。AlexNet首次使用了Relu激活函数。
CIFAR是一个包含十个分类的彩色图像数据集，共包含60000张32*32的彩色图像（包含50000张训练图片，10000张测试图片），数据集是三通道的，分别是R，G，B3 个通道被广泛用于训练和测试机器学习模型的性能。

3.VGG Net

VGG Net是一种深度卷积神经网络的模型，用于图像识别和分类。该模型结构非常深，拥有多个卷积层和池化层。VGG Net是由LeNet、Alexnet发展而来的，VGGnet相比于Alex-net而言，具有更小的卷积核，都是3x3的，而Alex-net卷积核较大（11x11，7x7，5x5）。并且相比于AlexNet的3x3的池化核，VGG全部为2x2的池化核。其结构如下图所示：
在这里插入图片描述