VGG数据预处理

最新推荐文章于 2023-04-06 22:48:01 发布

z0n1l2

最新推荐文章于 2023-04-06 22:48:01 发布

阅读量3.4k

点赞数

分类专栏：深度学习文章标签： VGG imagenet

深度学习专栏收录该内容

49 篇文章 1 订阅

订阅专栏

参考文献

Very Deep Convolutional Networks for Large-Scale Image Recognition

本文的目的

目标检测/语义分割等领域都会涉及到预训练模型，一般是在ImageNet上训练出来的一个分类模型，但是ImageNet和cifar/mnist不同，

一个图可能包含多个目标
目标的尺寸不固定
图像尺寸不固定
图像长宽比不固定
这种集合如何用来训练分类模型？

VGG的方法

图片的短边缩小到固定大小S
文中称S为scale，S的变换认为属于样本增广的一种：scale jittering。后续实验证明scale jittering是有利于泛化。把S推广到一个区域间 $S_{min},S_{max}]$ 就是multi-scale，否则是single-scale，实验证明multi-scale更好。需要注意的是此处scale不是图像内容的尺度，即使S只有一个值，整个数据集中目标也包含多个尺度
缩小后的图片中，随机裁剪出224x224的子图，作为网络输入
理论上S可以取任意不小于224的值，如果S很大，则crop后224x224子图可能包括很小的目标，只覆盖一部分图像内容；如果S很小，则crop后的224x224子图可以覆盖大目标，包括了大部分图像内容。
论文中尝试了256和384两个值，推广到区间，论文中尝试的是[256,512], 每次随机从区间内取一个值，作为当前的S值。
training阶段可以有多个尺度，testing阶段也可以有多个尺度，最后的输出是多个尺度的结果的平均值，实验也证明，testing阶段多个尺度效果较好

附图

single-scale
mutiple-scale

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

z0n1l2 CSDN认证博客专家 CSDN认证企业博客

码龄6年

66: 原创

18万+: 周排名

48万+: 总排名

26万+: 访问

: 等级

3345: 积分

28: 粉丝

77: 获赞

27: 评论

324: 收藏

私信

关注

热门文章

分类专栏

3D 1篇
深度学习 49篇
文献阅读 9篇
三省吾身 21篇
scrapy 1篇
docker 2篇
pytorch 1篇
darknet 9篇
数据分析 6篇
pandas 3篇
mxnet 9篇
codes 21篇
NLP 2篇
backup 5篇
RL 2篇
stat-of-art 3篇

最新评论

深度学习和传统机器学习的差别
qyys30: 豁然开朗
从FocalLoss到hardsample
weixin_39542692: adaboost中样本权重更新的思路和focus loss一致. 赞
从FocalLoss到hardsample
weixin_39542692: adaboost中样本权重更新的思路和focus loss一致. 赞
时间序列分析-linear-models-to-GARCH
Tiana_amazing: 楼主好，请问下arma22 = smt.arma_generate_sample(ar=ar, ma=ma, nsample=n, burnin=burn)生成模拟时间序列数据的时候，不考虑白噪声嘛
darknet-配置参数burn-in
一个努力学编程的女子: 博主，有实现warmingup功能的代码可以分享吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。