计算机视觉（5）—— 图像分类

清园暖歌

已于 2023-05-10 21:21:47 修改

阅读量539

点赞数

分类专栏：计算机视觉文章标签：计算机视觉人工智能

于 2023-05-09 21:55:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47941078/article/details/130501358

版权

计算机视觉专栏收录该内容

5 篇文章 3 订阅

订阅专栏

文章介绍了图像分类领域的几个关键模型，包括AlexNet、VGG、不同版本的Inception网络（如InceptionV1至V4）以及ResNet和ResNeXt。Inception网络通过全局平均池化解决梯度消失问题，ResNet利用残差结构减少计算量。文章还提及了CNN设计的一些准则。

摘要由CSDN通过智能技术生成

目录

五、图像分类

5.3 GoogLeNet、Inception

5.3.1 Inception V1

5.3.2 Inception V2

5.3.3 Inception V3

5.3.4 Inception V4

5.4 ResNet 残差网络

5.5 CNN设计准则

五、图像分类

5.1 AlexNet

5.2 VGG

5.3 GoogLeNet、Inception

5.3.1 Inception V1

全连接层参数过多，所以要改进

GAP：全局平均池化

在梯度要消失的地方，再次传入

5.3.2 Inception V2

（1）训练时要将traning参数设置为True，在验证时将trainning参数设置为False。在pytorch中可通过创建模型的model.train()和model.eval()方法控制。
（2）batch size尽可能设置大点，设置小后表现可能很糟糕，设置的越大求的均值和方差越接近整个训练集的均值和方差。
（3）一般将bn层放在卷积层（Conv）和激活层（例如Relu）之间，且卷积层不要使用偏置bias。

5.3.3 Inception V3

5.3.4 Inception V4

VGG是大多数的主干模型，Google的可扩展性相对差一点

5.4 ResNet 残差网络

5.4.1 ResNet

优化：用1×1卷积先降维减少计算量，再升维和前面的残差块组合

FLOPs这里是指需要的计算量

5.4.2 ResNeXt

5.5 CNN设计准则

这里不一定分组卷积就比整个卷积强

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
1
评论
计算机视觉（5）—— 图像分类

优化：用1×1卷积先降维减少计算量，再升维和前面的残差块组合。全连接层参数过多，所以要改进。VGG是大多数的主干模型，Google的可扩展性相对差一点。GAP：全局平均池化。FLOPs这里是指需要的计算量。这里不一定分组卷积就比整个卷积强。在梯度要消失的地方，再次传入。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

清园暖歌 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。