自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 You Only Look Once: Unified, Real-Time Object Detection

这是Ross Girshick大神在fast rcnn之后的又一力作,不过这篇论文似乎推翻了rbg大神在rcnn那篇论文中结论,即可以把检测任务归并为分类任务,而是又把检测任务归为回归任务去解。下面说一下这篇文章的主要思想: 上图是YOLO的主要流程,首先把整幅图片划分为7x7个块,然后根据ground truth 找到中心点,并把物体所在的中心点归为某个块中。网络的后端两个全链接层,这里需要

2016-03-09 20:51:42 3765 2

原创 目标检测——从RCNN到Faster RCNN 串烧

本人小硕一枚,方向是深度学习的目标检测,故想把从RCNN到Faster RCNN整个线串一下,理清里面的整个设计流程和创新思路,也算是对大神的创新思维进行学习。我会不定期改善博客里面可能存在的小错误,希望大家多多谅解支持啦。另外,在论文中已经讲到的点,如果不是特别重要的话,我不会再复述的啦,所以说各位看官先研读研读论文先,然后再看看我对这些论文的理解。对了,涉及到哪层是几乘几以及那层到底是多少这种细

2016-03-07 11:20:40 29095 3

原创 ubuntu+caffe+gpu 安装配置流程

我是使用ubuntu 14.04系统,基本上根据官网安装教程进行安装,当然也参考了许多别人的blog,所以我算是一个搬运工吧,写这个教程是为了给之前写的fast rcnn环境配置写个前传吧。首先,安装官网所说的,对自己的硬件环境进行一个预检查,即是否有个合适的预检查gpu,lspci | grep -i nvidia;//是否有个支持的系统版本uname -m && cat /etc/*relea

2016-03-06 21:45:43 3892 2

原创 From Facial Parts Responses to Face Detection: A Deep Learning Approach

这篇是汤晓欧组最新的一篇人脸检测的论文,在FDDB上论文组中,目前取得第一的好成绩。故拿此文拜读一番,写篇读后感: 首先,作者提出一个Faceness net的概念,这个概念实际上很简单,就是训练人脸五个部位的模型,然后针对这五个部位的模型提出来的特征,通过人脸共有先验,设计出一个计算是否是人脸的得分,其中,模型的超参数λ\lambda用最大后验概率计算。 下面我主要讲一下5个模型的训练以及fa

2016-03-06 19:59:50 1900 4

原创 caffe 如何调用python层

这两天一直在研究faster rcnn的源码,可是依旧感觉云里雾里,故下定决心把caffe调用python layer的流程仔细走一遍,好明白到底是什么在调用python layer。话说 linux 调试还真是蛋疼啊,木有ide那样直接下断点,gdb又不会用,只能傻比比的不断的LOG(INFO)输出。还好最终还是明白了,我就直接顺着faster rcnn来说,并记录在此。faster rcnn最

2015-12-30 12:44:59 10805 10

原创 针对Faster RCNN具体细节以及源码的解读之SmoothL1Loss层

从今天开始,阅读faster rcnn的相关代码,并记录我对faster rcnn中特别的层的理解。本篇主要是对smooth_L1_Loss层进行解读。 RBG大神认为CPU版本的太慢了,故有些操作CPU版压根就没有实现。smooth_L1_Loss是Faster RCNN提出来的计算距离的loss,文章中提到对噪声点更加鲁棒。 输入四个bottom,分别是predict,target,insi

2015-12-28 20:19:53 26906 3

原创 针对Faster RCNN具体细节以及源码的解读之RoIPooling层

从今天开始,阅读faster rcnn的相关代码,并记录我对faster rcnn中特别的层的理解。注意,RBG大神认为CPU版本的太慢了,故有些操作CPU版压根就没有实现。RoI Pooling就是实现从原图区域映射到conv5区域最后pooling到固定大小的功能。输入,b0 为卷积的feature map,b1 为rois。LayerSetUp将参数赋值。Reshape将

2015-12-28 19:09:55 29402 4

原创 Fast RCNN的配置流程

Fast RCNN是由RBG大神写的一个目标检测的算法,它结合了RCNN和SPP,使得前向计算更加简单高效,具体细节见其他博客,本篇主要写的是如何配置Fast RCNN。按照RBG大神github上给的流程,先git下整个工程项目并用cython将python编译成c文件,当我编译的时候,居然有报错,唉,出师不利啊,很明显是cython有问题。报错如下:UnicodeDecodeError

2015-12-23 10:38:09 3007

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除