目标检测论文解读
带领读者一起征服目标检测
月臻
stay foolish,stay hungry!
展开
-
Deformable Convolutional Network论文解读
卷积神经网络由于固定的几何结构一直受限于对几何形变的建模,这篇工作引入了两个新模块——deformable convolution和deformable RoI pooling。deformable convolution 和deformable RoI pooling都是基于一个平行网络分支学习offset(偏移),使卷积核在input map的采样点发生偏移,集中于我们感兴趣的区域或目标。同时...原创 2019-11-25 11:49:19 · 793 阅读 · 0 评论 -
RFB-Net论文解读
论文链接:Receptive Field Block Net for Accurate and FastObject Detection代码链接:https://github.com/ruinmessi/RFBNet目前state-of-art的目标检测网络主要是两条路子:two-stage:先只区分前景、背景的region proposals,同时进行第一次bounding boxes...原创 2019-11-22 20:31:44 · 1574 阅读 · 0 评论 -
YOLO_v3论文解读
摘要我们对YOLO做了一些设计上的变化来使得它运行的更好,并对新网络重新训练,也证明了新网络可以工作的很好,它虽然比之前的网络(YOLO v1和v2)稍微大了一点,但是它的精度更高了。同时检测速度也很快,这一点不用担心,对于 320 ×\times× 320的输入,YOLOv3用了22ms实现了28.2的mAP,这个精度与SSD一样高,但是速度却快了三倍。当我们使用旧的 IOU = 0.5 作为...原创 2019-07-30 13:56:40 · 1147 阅读 · 1 评论 -
SSD-PyTorch源码解析
pytorch代码链接:https://github.com/amdegroot/ssd.pytorch一. 网络结构1. VGGSSD 使用了VGG16(D)卷积部分(5层卷积,一般标记为Conv5)作为基础网络,后面加了 1024 × 3 × 3、1024 × 1 × 1 两个卷积层,这两个卷积层后都有 RELU 层。对应的网络结构如下图,红线以上部分是VGG16本来就有的卷积层,红线...原创 2019-05-19 23:36:30 · 4449 阅读 · 11 评论 -
SSD:Single Shot MultiBox Dectector算法解读
论文链接:https://arxiv.org/abs/1512.02325代码链接:https://github.com/weiliu89/caffe/tree/ssd摘要我们提出了一种one-stage的多框预测检测器,称为SSD,它是将边框的输出空间离散化成一组不同长宽比和尺寸的边界框。在预测期间,网络会对每一个边框的每一个类别都进行评分,并且会调整原始的边框来使其更好的匹配目标形状。另...原创 2019-05-17 16:58:56 · 1177 阅读 · 0 评论 -
Faster R-CNN论文解读
论文链接:https://arxiv.org/abs/1506.01497代码链接:https://github.com/rbgirshick/py-faster-rcnn因为R-CNN到Fast R-CNN再到Faster R-CNN是一个递进的改进过程,所以对前两个不清楚的还是要先去读一读这两篇文章,我在下面提出自己的读书笔记(私以为还是写的很全面的,对很多其他博客里面没有提到的坑都有涉及...原创 2019-04-11 12:40:36 · 483 阅读 · 0 评论 -
YOLO_v1(You Only Look Once)论文解读
论文链接:https://arxiv.org/abs/1506.02640Abstract我们提出了一种新的目标检测算法——YOLO。之前的目标检测都是基于two-stage的工作,先要提出候选框,然后再对提出的候选框做分类和边框回归;而我们是将目标检测看作一项回归任务,从空间上分割边界框和相关的类别概率,使用单个网络在一个评估中直接对整张图像中边界框和所属类别概率进行预测。由于整个检测流水线...原创 2019-05-17 17:20:45 · 1540 阅读 · 0 评论 -
Fast R-CNN论文解读
论文链接:https://arxiv.org/abs/1504.08083代码链接:https://github.com/rbgirshick/fast-rcnn.Abstract这篇论文提出了一种基于卷积神经网络做目标检测的算法——Fast R-CNN,它是建立在之前R-CNN的基础上使用深度卷积神经网络进行高效的目标检测。Fast R-CNN做了几点创新来提高训练和测试阶段的速度,同时提...原创 2019-04-09 18:16:18 · 15424 阅读 · 1 评论 -
视觉探测任务
视觉探测任务1.1 探测任务简介分类是对图像中仅有的主体分类,而定位就是对图像中仅有的主体进行分类并给出位置;检测则是对多个主体进行定位。Bounding box:(bx, by, bw, bh),bx和by分别为要识别主体的中心点坐标,而bw和bh为识别主体的长宽,这样只需要四个参数就可以将主体的位置确定。2.1 siliding windows & IoU滑窗就是把原图切成许...原创 2019-02-25 10:09:09 · 727 阅读 · 0 评论 -
R-CNN论文解读
论文链接:https://arxiv.org/abs/1311.2524论文题目:《Rich feature hierarchies for accurate object detection and semantic segmentation》2014【用于精确物体定位和语义分割的丰富特征层次结构】先来介绍一下几个基本的概念:分类是对图像中仅有的主体分类;定位就是对图像中仅有的主体...原创 2019-04-08 14:20:36 · 1033 阅读 · 0 评论 -
YOLO v3 PyTorch版本源码解读(一):模型结构解读
PyTorch 代码链接:https://github.com/ultralytics/yolov3本篇主要是对代码文件中 models.py的解读,同时由于用到了utils文件夹下 parse_config.py中的两个函数,所以也对其进行了分析。1. utils文件夹1.1. parse_config.py这个py文件中定义了两个函数——parse_model_cfg和parse_da...原创 2019-09-05 20:20:09 · 8583 阅读 · 5 评论 -
YOLO v3 PyTorch版本源码解读(二):数据集的读取以及网络的训练
PyTorch 代码链接:https://github.com/ultralytics/yolov3本篇主要是对代码文件中 原始数据读取方式 的解读,集中分析了 utils 文件夹下的 datasets.py函数。1. datasets.py1.1 letterbox函数我们知道 yolo v3是支持任意尺寸的图片输入的,但我们定义的网络结构是输入尺寸是固定的,所以在读取 原始图片时肯定...原创 2019-09-10 19:13:24 · 5316 阅读 · 3 评论