【论文复现】VGG框架讲解以及VGG16复现,迁移学习自己的数据。tensorflow。

本文介绍了VGG框架的核心特点,包括固定大小的224×224 RGB图像输入、预处理过程以及1×1和3×3卷积滤波器的使用。在训练中,可能会遇到GPU资源不足的问题,可通过调整batch_size或指定GPU设备来解决。VGG模型分为VGG16和VGG19两种,错误示例中展示了内存溢出问题的解决方案。
摘要由CSDN通过智能技术生成

论文链接,至于论文我没仔细看,我只学习了其框架。

但是需要注意的是:

在训练期间,ConvNets的输入是固定大小的224×224 RGB图像。 唯一预处理是从每个像素中减去在训练集上计算的平均RGB值,(eg:VGG16是:VGG_MEAN = tf.constant([123.68, 116.779, 103.939], dtype=tf.float32))处理时候转换成了RGB→BGR格式。图像通过一堆卷积(转换)层,使用具有非常小的感知域的滤波器: 3×3(这是捕捉左/右,上/下,中心概念的最小尺寸)。 在其中一种配置中,我们还使用1×1卷积滤波器,可以看作是输入通道的线性变换(后面是非线性)。 卷积步幅固定为1个像素; 卷积层输入的空间填充使得在卷积之后保持空间分辨率,即对于3×3个卷积层,填充是1个像素。 空间池由五个最大池组执行,这些层跟随一些转换。 图层(并非所有转换图层都跟随最大池)。 最大池化在2×2像素窗口上执行,步幅为2。

卷积层(在不同的体系结构中具有不同的深度)的stack之后是三个完全连接(FC)层:前两个层各有4096个通道,第三个层执行1000路ILSVRC分类,因此包含1000个通道(每个类一个)。最后一层是so

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值