计算机视觉(5)—— 图像分类

文章介绍了图像分类领域的几个关键模型,包括AlexNet、VGG、不同版本的Inception网络(如InceptionV1至V4)以及ResNet和ResNeXt。Inception网络通过全局平均池化解决梯度消失问题,ResNet利用残差结构减少计算量。文章还提及了CNN设计的一些准则。
摘要由CSDN通过智能技术生成

目录

五、图像分类

5.1 AlexNet

5.2 VGG

5.3 GoogLeNet、Inception

5.3.1 Inception V1 

5.3.2 Inception V2

5.3.3 Inception V3 

5.3.4 Inception V4 

5.4 ResNet 残差网络

5.4.1 ResNet

5.4.2 ResNeXt

5.5 CNN设计准则

五、图像分类

5.1 AlexNet

 

5.2 VGG

 

5.3 GoogLeNet、Inception

5.3.1 Inception V1 

                全连接层参数过多,所以要改进 

         GAP:全局平均池化 

在梯度要消失的地方,再次传入

5.3.2 Inception V2

(1)训练时要将traning参数设置为True,在验证时将trainning参数设置为False。在pytorch中可通过创建 模型的model.train()和model.eval()方法控制。
(2)batch size尽可能设置大点,设置小后表现可能很糟糕,设置的越大求的均值和方差越接近整个训练集的均值和方差。
(3)一般将bn层放在卷积层(Conv)和激活层(例如Relu)之间,且卷积层不要使用偏置bias。

5.3.3 Inception V3 

 

5.3.4 Inception V4 

VGG是大多数的主干模型,Google的可扩展性相对差一点

5.4 ResNet 残差网络

5.4.1 ResNet

        优化:用1×1卷积先降维减少计算量,再升维和前面的残差块组合

FLOPs这里是指需要的计算量 

5.4.2 ResNeXt

 

5.5 CNN设计准则

这里不一定分组卷积就比整个卷积强

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

清园暖歌

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值