Pytorch 图像分类（AlexNet，VGGNet，Inception，ResNet，DenseNet，MobileNet）

最新推荐文章于 2024-07-21 19:23:53 发布

不会写作文的李华

最新推荐文章于 2024-07-21 19:23:53 发布

阅读量4.7k

点赞数 6

分类专栏： Pytorch 图像分类文章标签：卷积神经网络深度学习 pytorch

本文链接：https://blog.csdn.net/qq_40195360/article/details/105559029

版权

本文介绍了PyTorch中常用的几个经典图像分类网络，包括AlexNet、VGGNet、Inception、ResNet、DenseNet和MobileNet。这些网络在ILSVRC比赛中取得了优异成绩，展示了深度学习在图像识别领域的强大能力。每个网络都有其独特设计，如AlexNet的GPU加速和ReLU激活，VGGNet的深度探索，Inception的高效计算，ResNet的残差学习，DenseNet的密集连接，以及MobileNet的轻量化深度可分离卷积。这些网络结构和思想对现代深度学习有着深远影响。

摘要由CSDN通过智能技术生成

文章目录

前言

其实现阶段图像分类网络已经发展的很好了，本文只是简单的罗列一下经典的分类网络的基本思想，不涉及代码。其实在使用pytorch的基础上，里面的TORCHVISION.MODELS已经帮我们封装好了，直接使用就可以。

1. AlexNet

AlexNet是2012年ILSVRC 2012（ImageNet Large Scale Visual Recognition Challenge）竞赛的冠军网络，分类准确率由传统方法的 70%+提升到 80%+（当时传统方法已经进入瓶颈期，所以这么大的提升是非常厉害的）。它是由Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后，深度学习开始迅速发展。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ggMczuOs-1587022068848)(attachment:image.png)]

AlexNet 一些性质：

首次利用 GPU 进行网络加速训练。
使用了 ReLU 激活函数，而不是传统的 Sigmoid 激活函数以及 Tanh 激活函数。
使用了 LRN 局部响应归一化。
在全连接层的前两层中使用了 Dropout方法按一定比例随机失活神经元，以减少过拟合。

AlexNet GitHub

2. VGGNet

VGGNet由牛津大学计算机视觉组合和Google DeepMind公司研究员一起研发的深度卷积神经网络。它探索了卷积神经网络的深度和其性能之间的关系，通过反复的堆叠33的小型卷积核和22的最大池化层，成功的构建了16~19层深的卷积神经网络。VGGNet获得了ILSVRC 2014年比赛的亚军和定位项目的冠军，在top5上的错误率为7.5%。目前为止，VGGNet依然被用来提取图像的特征。在原论文中给出了一系列VGG模型的配置，下面这幅图是VGG16模型的结构简图。
在这里插入图片描述
VGGNet 一些性质：

通过堆叠多个3x3的卷积核来替代大尺度卷积核（在拥有相同感受野的前提下能够减少所需参数）。
VGGNet作者总结出LRN层作用不大，越深的网络效果越好。
11的卷积也是很有效的，但是没有33的卷积效果好，因为3*3的网络可以学习到更大的空间特征。

VGGNet的网络结构如下图所示。VGGNet包含很多级别的网络，深度从11层到19层不等，比较常用的是VGGNet-16和VGGNet-19。VGGNet把网络分成了5段，每段都把多个3*3的卷积网络串联在一起，每段卷积后面接一个最大池化层，最后面是3个全连接层和一个softmax层。

在这里插入图片描述

VGGNet GitHub

3. Inception

Google InceptionNet出现在ILSVRC2014年的比赛中（和VGGNet同年），并以较大优势夺得了第一名的成绩，它的top5错误率为6.67%，VGGNet的错误率为7.3%。InceptionNet的最大特点是控制了计算量和参数量的同时提高了网络的性能，它的层数为22，比VGGNet19还深，但是只有15亿次浮点计算和500万的参数量。InceptionNet精心设计的Inception Module也很大程度上提高了参数的利用率。

最低0.47元/天解锁文章

不会写作文的李华

关注

6
点赞
踩
46

收藏

觉得还不错? 一键收藏
0
评论
Pytorch 图像分类（AlexNet，VGGNet，Inception，ResNet，DenseNet，MobileNet）

4.定义网络（AlexNet）[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ggMczuOs-1587022068848)(attachment:image.png)]AlexNet 结构：输入层：图像大小为 227×227×3，其中 3 表示输入图像的 channel 数（R，G，B）为 3。卷积层：filter 大小 11×11，filter 个数 9...
复制链接

扫一扫

专栏目录