vgg论文笔记

1.训练期间,输入图像固定为224x224唯一的预处理是从每个像素中减去在训练集上计算的RGB均值。

2.都由5层卷积层、3层全连接层组成

3。使用小卷积核(3x3)减少参数。

4.Vgg网络结构中图像慢慢缩小,,减小的太快就容易损失过多重要信息。增加厚度来减少损失。

5.采用了尺度抖动,测试时的尺度抖动导致了更好的性能。S为训练图像的最小边,训练尺度。单尺度训练:按照固定ss=256s=384来缩放)

6.Dense(密集评估):即指全连接层替换为卷积层(第一FC层转换到7×7卷积层,最后两个FC层转换到1×1卷积层),最后得出一个预测的score map,再对结果求平均。

7.Multi-crop(多裁剪评估):即对图像进行多样本的随机裁剪。对三个尺度上每个尺度进行50次裁剪(5x5大小的正常网格,并进行两次翻转)即总共150次裁剪的效果图,然后通过网络预测每一个样本的结构,最终对所有结果平均。

8.使用多裁剪图像表现比密集评估略好

9.采用卷积网络融合,将性能良好的两种网络融合。通过对soft-max类别后验进行平均,结合了几种模型的输出。由于模型的互补性,这提高了性能。

 

作者通过试验发现当使用固定值S训练时,Q的范围在[S−32,S,S+32]之间时,测试的结果与训练结果最接近,否则可能由于训练和测试尺度之间的巨大差异导致性能下降 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值