【22-23春】AI作业10-经典卷积网络

最新推荐文章于 2024-09-27 16:14:00 发布

吵闹の雪

最新推荐文章于 2024-09-27 16:14:00 发布

阅读量116

点赞数 1

文章标签：人工智能深度学习神经网络

本文链接：https://blog.csdn.net/winter_poi1120/article/details/130742479

版权

LeNet & MNIST
LeNet是由Yann LeCun等人于1998年提出，用于手写数字识别任务。其结构主要包括两个卷积层和三个全连接层，其中使用了Sigmoid激活函数和局部响应归一化（LRN）操作。LeNet奠定了卷积神经网络在图像识别上的基础，并对后来的深度学习技术发展产生了至关重要的影响。
MNIST是一个流行的手写数字数据集，包含60000张训练图片和10000张测试图片。图片是单通道灰度图像。MNIST被广泛用于测试各种机器学习算法尤其是分类算法的性能表现，也常被作为卷积神经网络的入门任务。因为它相对简单，所以可以快速验证不同的模型架构或者算法的可行性。
AlexNet & CIFAR
AlexNet是一种深度卷积神经网络。该模型具有8层神经网络结构，其中包括5个卷积层和3个全连接层，并且引入了ReLU激活函数、Dropout随机失活等技术，有效地提高了模型的性能表现。AlexNet极大地促进了深度神经网络的发展，并成为计算机视觉领域的里程碑之一。
CIFAR是一个用于目标分类和目标检测的图像数据集，共分为CIFAR-10和CIFAR-100两类。CIFAR-10包含10个类别的32x32大小的RGB彩色图像60000张，每个类别各6000张；而CIFAR-100包含100个类别，每个类别包含600张图像。这些图像通常较为复杂，使得算法需要更多的抽象和泛化能力来进行区分。CIFAR数据集被广泛用来评估不同深度学习和机器学习算法在小规模图像数据上的表现，因此也是开展计算机视觉研究的重要基准测试数据集之一。
VGG Net
VGG Net是一个深度卷积神经网络，由Karen Simonyan和Andrew Zisserman等人于2014年提出。采用了一系列的3×3大小的卷积层堆叠来代替AlexNet中更大尺寸的卷积核，使得网络有更小的参数量并提高了泛化能力。通过增加卷积层数目的方式，展示了深度神经网络对图像识别问题的有效性。在ImageNet图像分类和定位任务上获得了当时最好的结果之一，奠定了深度卷积神经网络在计算机视觉领域的地位。同时，该模型还被广泛用于其它图像相关任务，如对象检测、图像分割等。
GoogLeNet & Inception v1
GoogLeNet是一个深度卷积神经网络，由Google团队的Christian Szegedy等人于2014年提出。该模型主要采用了Inception结构，将不同大小的卷积核和Pooling层在同一层次上进行拼接，使得模型可以同时获得不同尺寸的特征信息并减轻了计算负担。GoogLeNet还引入了全局平均池化层和辅助分类器等技术，用来进一步提高模型性能。
Inception v1是GoogLeNet中的原始版本，基于Inception模块重新设计了神经网络结构。Inception模块增加了网络的宽度，意味着更多的通道数量，以及增加了卷积核的大小和数量，在保持模型参数量相对较小的情况下，有效地提高了模型的性能表现。
ResNet
ResNet是一种深度残差神经网络，由Kaiming He等人于2015年提出。ResNet采用残差块（Residual Block）来构建网络，通过引入shortcut连接（又称跳跃连接或者残差连接）来使得前后层之间可以进行直接传递信息，从而避免了梯度消失和梯度爆炸，减少了训练深度神经网络的难度。该模型主要解决了深度神经网络的退化问题，即随着网络层数增加，模型精度反而逐渐下降的问题。ResNet有着较高的性能表现和泛化能力，被广泛应用于目标分类、对象检测、图像分割等计算机视觉领域的任务中。