行人检测
文章平均质量分 52
GuanghaoChen
这个作者很懒,什么都没留下…
展开
-
R-CNN论文阅读笔记
背景目标检测包含三个模块: 1. Catogory-independent Reigion与类别无关的区域提取; 2. CNN提取定长的特征向量 3. 线性SVM分类器候选区域提取方法 objectness, selective search, category-independent object proposals。因为CNN特征提取和候选区域提取无关,因此本文选择se...原创 2018-03-04 15:17:40 · 168 阅读 · 0 评论 -
INRIA数据集转换成VOC格式
背景下面的代码是将INRIA数据集转换成VOC格式。图片是614张。 其中,使用OinginImage文件夹里的Train中Pos和Annotations作为训练,利用Test里的Pos作为测试。# -*- coding: UTF-8 -*-from xml.dom.minidom import Documentimport osimport relist = os.listd...原创 2018-05-09 21:48:22 · 3030 阅读 · 8 评论 -
Caltech数据读取接口
1. 引言在上一篇我们详述了如何将Caltech数据集转化成VOC格式的数据集,在使用之前,我们需要编写读取数据集的接口2. 先上结果下图是进行了50000次训练后,在测试集上进行训练的结果。我这个结果偏低,因为有person和people的区分在内部会导致一些测试出错。 下图是从网络上随意下载的一副图像,前面的那个那么明显的人都没有检测到!!!不明白为什么,难道是穿着问题?...原创 2018-04-22 15:07:58 · 1445 阅读 · 0 评论 -
Faster R-CNN解读
引言论文:《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》 详细内容可以参看博客,我只记录一些我自己的理解。摘要1.提出使用RPN网络替代R-CNN和Fast R-CNN中的区域提取Selective Search 2.采用RPN和Fast R-CNN交替训练的方式...原创 2018-04-02 15:55:07 · 308 阅读 · 0 评论 -
Caltech行人数据集转化VOC数据集
CaltechPestrian2VOC代码仓库地址将Caltech数据集转化成PASCAL VOC的格式,下载地址文件结构如下:其中红框中的是原始的文件夹,其余4个文件夹是在执行过程中生成的1. Seq文件转化成JEPG图像文件调用seq2jpg.py文件,输入data文件夹,输出到JPEG文件夹中2. VBB标注文件转化为XML文件调用vbb2voc.py文件...原创 2018-04-09 17:31:18 · 6838 阅读 · 23 评论 -
VOC2007数据集解析
下载首先从网站上下载VOC2007数据集下载链接文件结构概述下载后的数据文件主要包含以下内容: 由于我们是将数据用于检测,因此,我们只关注Annotation,ImageSets和JPEGImages三个文件夹。下面我们逐个分析每一个文件夹下面的内容:JPEGImages这个文件夹主要放置数据的原始图片,图片的文件名用00001.jpg进行命名。 ...原创 2018-03-30 15:25:51 · 33033 阅读 · 14 评论 -
SmallCorgi/TF-Faster RCNN测试
环境配置Github上给出SmallCorgi的链接TF-Faster RCNN,按照要求配置环境。sudo pip install cythonsudo pip install easydictsudo pip install opencv-python进入lib文件夹,make编译源代码。 ————————————注意———————————————— 后面测试的时候仍然...原创 2018-03-30 00:23:18 · 1540 阅读 · 0 评论 -
Fast R-CNN
引言这是RBG的第2篇目标检测论文,主要内容是对R-CNN和SPP-Net进行改进。R-CNN和SPP-Net的问题前者的feature map计算冗余,没有共享,在SPP-net中被解决; -后者的 Pipeline之间是独立的,因此feature都被写入了磁盘Fast R-CNN的贡献mAP值更高(废话,不高你发出来)引入了multi-task loss,...原创 2018-03-29 23:38:24 · 159 阅读 · 0 评论 -
SPP-Net
引言该方法由Kaiming He提出,主要目的是解决RBG提出的R-CNN网络的几个缺点。与R-CNN的对比R-CNN的问题R-CNN需要保证所有的图片尺寸是相同的。主要原因在于:R-CNN在全连接层的输入要求是固定尺寸,这就要求保证CNN网络的输入尺寸相同才能满足。R-CNN为了保证图片尺度相同,对图片进行裁剪/扭曲操作,但是这样的变型操作会丢失信息。如图1左侧,由...原创 2018-03-23 22:17:06 · 237 阅读 · 0 评论 -
Pedestrian Detection: An Evaluation of the State of the Art
3.评估方法3.1整图评估a0=area(BBdt∩BBgt)area(BBdt∪BBgt)>0.5a0=area(BBdt∩BBgt)area(BBdt∪BBgt)>0.5a_0=\frac{area(BB_{dt}\cap BB_{gt})}{area(BB_{dt}\cup BB_{gt})}>0.5知识点:FPPI:False Positive Per ...原创 2018-03-05 22:03:32 · 1004 阅读 · 0 评论 -
行人检测数据集
背景常见数据集CaltechCaltech数据集包含10小时市场的视频文件,其分辨率是640x480。数据集标注了250000帧,包括350000标注框。 数据包含文件夹set00-set10,其中set00-set05是训练数据,set06-set10是测试集。 Caltech数据集的格式是Seq,因此我们需要参考该文章进行转换。Seq数据集转换图片格式...原创 2018-03-04 14:49:09 · 5562 阅读 · 0 评论 -
CVPR2018论文阅读--Occluded Pedestrian Detection Through Guided Attention in CNNs
引言原创 2018-07-11 19:48:51 · 2553 阅读 · 0 评论