目标检测
文章平均质量分 78
xyy19920105
这个作者很懒,什么都没留下…
展开
-
针对Faster RCNN具体细节以及源码的解读之RoIPooling层
从今天开始,阅读faster rcnn的相关代码,并记录我对faster rcnn中特别的层的理解。注意,RBG大神认为CPU版本的太慢了,故有些操作CPU版压根就没有实现。RoI Pooling就是实现从原图区域映射到conv5区域最后pooling到固定大小的功能。输入,b0 为卷积的feature map,b1 为rois。LayerSetUp将参数赋值。Reshape将原创 2015-12-28 19:09:55 · 29411 阅读 · 4 评论 -
针对Faster RCNN具体细节以及源码的解读之SmoothL1Loss层
从今天开始,阅读faster rcnn的相关代码,并记录我对faster rcnn中特别的层的理解。本篇主要是对smooth_L1_Loss层进行解读。 RBG大神认为CPU版本的太慢了,故有些操作CPU版压根就没有实现。smooth_L1_Loss是Faster RCNN提出来的计算距离的loss,文章中提到对噪声点更加鲁棒。 输入四个bottom,分别是predict,target,insi原创 2015-12-28 20:19:53 · 26928 阅读 · 3 评论 -
caffe 如何调用python层
这两天一直在研究faster rcnn的源码,可是依旧感觉云里雾里,故下定决心把caffe调用python layer的流程仔细走一遍,好明白到底是什么在调用python layer。话说 linux 调试还真是蛋疼啊,木有ide那样直接下断点,gdb又不会用,只能傻比比的不断的LOG(INFO)输出。还好最终还是明白了,我就直接顺着faster rcnn来说,并记录在此。faster rcnn最原创 2015-12-30 12:44:59 · 10808 阅读 · 10 评论 -
Fast RCNN的配置流程
Fast RCNN是由RBG大神写的一个目标检测的算法,它结合了RCNN和SPP,使得前向计算更加简单高效,具体细节见其他博客,本篇主要写的是如何配置Fast RCNN。按照RBG大神github上给的流程,先git下整个工程项目并用cython将python编译成c文件,当我编译的时候,居然有报错,唉,出师不利啊,很明显是cython有问题。报错如下:UnicodeDecodeError原创 2015-12-23 10:38:09 · 3014 阅读 · 0 评论 -
From Facial Parts Responses to Face Detection: A Deep Learning Approach
这篇是汤晓欧组最新的一篇人脸检测的论文,在FDDB上论文组中,目前取得第一的好成绩。故拿此文拜读一番,写篇读后感: 首先,作者提出一个Faceness net的概念,这个概念实际上很简单,就是训练人脸五个部位的模型,然后针对这五个部位的模型提出来的特征,通过人脸共有先验,设计出一个计算是否是人脸的得分,其中,模型的超参数λ\lambda用最大后验概率计算。 下面我主要讲一下5个模型的训练以及fa原创 2016-03-06 19:59:50 · 1930 阅读 · 4 评论 -
目标检测——从RCNN到Faster RCNN 串烧
本人小硕一枚,方向是深度学习的目标检测,故想把从RCNN到Faster RCNN整个线串一下,理清里面的整个设计流程和创新思路,也算是对大神的创新思维进行学习。我会不定期改善博客里面可能存在的小错误,希望大家多多谅解支持啦。另外,在论文中已经讲到的点,如果不是特别重要的话,我不会再复述的啦,所以说各位看官先研读研读论文先,然后再看看我对这些论文的理解。对了,涉及到哪层是几乘几以及那层到底是多少这种细原创 2016-03-07 11:20:40 · 29142 阅读 · 3 评论 -
You Only Look Once: Unified, Real-Time Object Detection
这是Ross Girshick大神在fast rcnn之后的又一力作,不过这篇论文似乎推翻了rbg大神在rcnn那篇论文中结论,即可以把检测任务归并为分类任务,而是又把检测任务归为回归任务去解。下面说一下这篇文章的主要思想: 上图是YOLO的主要流程,首先把整幅图片划分为7x7个块,然后根据ground truth 找到中心点,并把物体所在的中心点归为某个块中。网络的后端两个全链接层,这里需要原创 2016-03-09 20:51:42 · 3772 阅读 · 2 评论