Object Detection paper reading
coder_nolan
这个作者很懒,什么都没留下…
展开
-
Object Detection 学习笔记 (1) R-CNN
paper reading 以下是博主认为文章中较重要的部分,内容为翻译加自己的理解。 Introduction 文章关注两个主要问题 使用深度网络解决目标定位问题 在已标注检测数据的数据量小的情况下,训练一个大容量的模型。 对于问题1的解决方案: 我们使用‘recognition with region’的方法来解决CNN定位的问题,此方法对目标检测和语义分割都有效。在测试时,对每张...翻译 2019-06-20 20:34:45 · 173 阅读 · 0 评论 -
Object Detection 学习笔记 (2) Fast R-CNN
Fast R-CNN 在R-CNN基础上做了改进,提高了检测速度和准确率,也提高了训练的时间、降低了存储量。 R-CNN速度慢的原因在于它对每个 region proposal 都分别放入卷积网络中计算,没有利用这些候选框之间重叠的部分来共享计算量,SPPnets(spatial pyramid pooling networks)针对 R-CNN 这个缺陷做的改进就是 把一整张图片放入卷积...原创 2019-06-22 22:04:17 · 134 阅读 · 0 评论 -
Object Detection 学习笔记 (3) Faster R-CNN
Faster RCNN相比 Fast RCNN 最大的改进应该是建立了 RPN,并借此提高了准确度和速度。 先上一张 VGG-16版本的结构图(图片来自https://blog.csdn.net/jufengwudi/article/details/78320705) 图1 用VGG-16实现的faster-rcnn结构图 Faster RCNN 的论文花了很大篇幅在介绍 RPN(...原创 2019-06-26 00:39:25 · 150 阅读 · 0 评论 -
Object Detection 学习笔记 (4) YOLO
《You Only Look Once: Unified,Real-Time Object Detection》 YOLO(You Only Look Once)属于 one-stage 方法。相比于 two-stage 的 RCNN系列,YOLO 的优势在于速度快,并且,与其他实时(real time)检测方法相比,YOLO的准确率更高。 YOLO 只有一个神经网络,输入一张图片可以直接输出...原创 2019-06-29 12:08:11 · 155 阅读 · 0 评论 -
Object Detection 学习笔记 (5) SSD
SSD需要一张输入图片、这张图片对应的groundtruth boxes, 然后在一些 feature maps 上执行这些操作: 以一张 feature map为例,假设它的大小是 8×8(这里暂时不提第三维),那么对于这64个locations的每一个,都各自设置x个大小和纵横比不同的 default boxes。 使用特定的匹配策略,为每一个groundtruth box 都至少匹配一个...原创 2019-08-31 16:40:31 · 167 阅读 · 0 评论