overfeat论文待续

最新推荐文章于 2024-03-01 20:54:42 发布

fffupeng

最新推荐文章于 2024-03-01 20:54:42 发布

阅读量645

点赞数

分类专栏： deep learning论文笔记 deep learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fffupeng/article/details/72848171

版权

deep learning论文笔记同时被 2 个专栏收录

16 篇文章 2 订阅

订阅专栏

15 篇文章 0 订阅

订阅专栏

从文章题目来看，Integrated recognition,localization and detection using convolutional network,就是将分类、定位、检测通过卷积网络整合在一起。

本文作者展示了：

1、在卷积网络中使用多尺度的滑动窗

2、介绍了通过训练深度网络来预测物体的定位框

3、可以使用一个网络同时进行多项任务

首先来理一理这分类，定位，检测的关系。

分类就是猜五个可能的类别，那就联系上常说的top5 error了。

定位就是猜五个类别的基础上加上每个类别可能的bounding box，iou>0.5才算正确。

检测任务和定位任务不同，因为可能出现任何数量的物体，通过mAP平均精度来衡量。

接下来讲分类任务：总体来讲分类任务使用的网络和alxnet相似，（这篇论文图表放置位置有点。。草率。。）

下表是fast版本的网络

下表是accurcy版本的网络

两个版本从层结构上来看相差不大，主要的区别在于卷积、池化核的大小和步长。总的来讲，核越小，步长越小，总体的精度就比较高。

下图就是fast版本第一层和第二层卷积核的可视化结果。

多尺度池化：scales + offset pooling

test时候，在alexnet使用了crop的小技巧，从图片中提取224x224块，四个角落加上中间，再进行水平翻转，一共得到十个图像，然后通过十个图像结果投票。

在overfeat中放弃这种方法，原因：

1、忽略很多区域

2、很多重复的计算，造成浪费

3、只适用于单一的尺度

因此作者采用了多尺度+偏置池化的方法，其中多尺度来自于在原图片上剪裁出不同大小的6张图片。如下表：

很明显由于输入的图片大小不一，所以卷积部分的输出特征数量是不一样的。

就像下图中，由于从输入14x14变成16x16，通过相同的卷积网络输出的特征图大小不一样。那作者又是如何连接卷积部分和fc部分呢？作者并没有将不同分辨率图片输出相同大小的feature map，而是使用了6个不同的分类器。如上图所示。

下图是单一尺度的偏置池化的例子：

offset设置为0,1,2，也就是初始池化的位置，也就是偏置offset，推广到二维空间中，也就是有9个初始池化的位置，然后对每个池化的结果都进行分类，这样就实现了offset pooling。而对于多尺度，只需要设置多个大小的池化核即可。

下面来看定位问题：

用回归层替换之前已经训练完的分类网络的分类层，并且训练网络使其在所有的位置和尺度上预测bbox，然后将两个回归结合在一起。

待续。。。。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

fffupeng CSDN认证博客专家 CSDN认证企业博客

码龄12年

90: 原创

14万+: 周排名

227万+: 总排名

14万+: 访问

: 等级

2267: 积分

21: 粉丝

38: 获赞

15: 评论

109: 收藏

私信

关注

热门文章

分类专栏

c++ 16篇
数据结构 4篇
deep learning论文笔记 16篇
linux 4篇
Leetcode 19篇
boost 3篇
plate recongnize
caffe 14篇
python 10篇
yolo 4篇
CUDA 1篇
cs231课程学习 6篇
deep learning 15篇
图像处理 4篇
电影
tensorflow 4篇
NS_ML 1篇

最新评论

yolo测试代码梳理
Tisfy: 看完之后，我激动的心情久久不能平复
caffe 添加Python层
马到成功.: 博主你好，我最近也在用caffe跑东西，但是遇到了点问题，想要请教下您，就是在执行训练文件的时候，代码运行到迭代部分就停在那不动了这是怎么回事呢？期待您的回复，谢谢。 [code=python] I0922 10:40:59.692507 9525 upgrade_proto.cpp:72] Successfully upgraded file specified using deprecated input fields. W0922 10:40:59.692509 9525 upgrade_proto.cpp:74] Note that future Caffe releases will only support input layers and not input fields. I0922 10:40:59.775990 9525 net.cpp:746] Ignoring source layer fc8 I0922 10:40:59.776000 9525 net.cpp:746] Ignoring source layer prob I0922 10:40:59.779959 9525 solver.cpp:57] Solver scaffolding done. I0922 10:40:59.780611 9525 caffe.cpp:239] Starting Optimization I0922 10:40:59.780618 9525 solver.cpp:289] Solving RankIQA_siamese_train_test I0922 10:40:59.780622 9525 solver.cpp:290] Learning Rate Policy: step I0922 10:40:59.782059 9525 solver.cpp:347] Iteration 0, Testing net (#0) [/code]
caffe 添加Python层
雨后天空sunny: 请问Python下添加layer的GPU 实现有模板吗？
导数，偏导，方向倒数，梯度
xuxiaoyi67: 666666666666666666666
yolo 源码分析
小小小吃货: 博主您好。请问在yolo.c的文件里面怎么修改？可以说一下您修改的过程吗？谢谢了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。