深度学习
JacobKong
欢迎来到孔伟杰(@JacobKong_Dev)的博客。 本人目前是北大信工的研一菜鸟一枚。 研究兴趣:计算机视觉|深度学习|行人检测。 欢迎大家一块儿交流!
展开
-
2017-02-27-深度学习论文笔记:R-FCN
Abstract提出了一个region-based, fully convolutional的网络来准确高效的进行物体检测。不同于Faster R-CNN,本论文的region-based detector是完全卷积化的,几乎一张图像上所有的计算都是共享的。为了实现这一目标,我们提出position-sensitive score maps,以解决在图像分类的平移不变性(translation原创 2017-02-27 22:39:56 · 2340 阅读 · 0 评论 -
深度学习读书笔记:DeepLearningBook - Chapter 9 - Conventional Networks
Chapter 9 Convolutional Networks(卷积神经网络)卷积网络仅仅是在其至少一个层中使用卷积代替一般矩阵乘法的神经网络。The Convolution OperationThe convolution operation is typically denoted with an asterisk:在卷积网络术语中,卷积的第一个参数(在本例中为函数x)通常称为 输入 ,原创 2017-02-20 23:15:49 · 912 阅读 · 0 评论 -
行人检测论文笔记:Histograms of Oriented Gradients for Human Detection
相关知识点从TP、FP、TN、FN到ROC曲线、miss rateTP:true positive,实际是正例,预测为正例FP:false positive,实际为负例,预测为正例TN:true negative,实际为负例,预测为负例FN:false negative,实际为正例,预测为负例fnr+tpr=1, fpr+tnr=1miss rate = FNR = 1 - true po原创 2017-02-18 20:57:38 · 2761 阅读 · 0 评论 -
深度学习读书笔记:DeepLearningBook - Chapter 9 - Conventional Networks
Chapter 9 Convolutional Networks(卷积神经网络)卷积网络仅仅是在其至少一个层中使用卷积代替一般矩阵乘法的神经网络。The Convolution OperationThe convolution operation is typically denoted with an asterisk: * 在卷积网络术语中,卷积的第一个参数(在本例中为函数x)通常称为原创 2017-02-18 20:58:39 · 2821 阅读 · 1 评论 -
行人检测论文笔记:How Far are We from Solving Pedestrian Detection?
文章疑问点Human Baseline 的标准是如何确定的?Ground-truth是什么意思?Groun-truth 指的是正确的标注(真实值)在有监督学习中,数据是有标注的,以(x, t)的形式出现,其中x是输入数据,t是标注.正确的t标注是ground truth,错误的标记则不是。(也有人将所有标注数据都叫做ground truth)。原创 2017-02-18 21:01:29 · 4732 阅读 · 0 评论 -
深度学习论文笔记:Rich feature hierarchies for accurate object detection and semantic segmentation
AbstractmAP: mean average precision,平均准确度我们的方法结合两个关键的见解:第一:采用高容量的卷积神经网络来从上到下的进行region proposal,从而实现定位和分割物体。当标记的训练数据稀缺时,可以先对辅助数据集(任务)进行受监督的预训练, 随后是基于域进行特定调整,产生显着的性能提升。Introduction关于各种视觉识别任务的上一个十年的进原创 2017-02-18 21:09:37 · 1930 阅读 · 0 评论 -
深度学习论文笔记:Fast R-CNN
知识点mAP:detection quality.Abstract本文提出一种基于快速区域的卷积网络方法(快速R-CNN)用于对象检测。快速R-CNN采用多项创新技术来提高训练和测试速度,同时提高检测精度。采用VGG16的网络:VGG: 16 layers of 3x3 convolution interleaved with max pooling + 3 fully-connected原创 2017-02-18 21:13:29 · 1795 阅读 · 0 评论 -
深度学习论文笔记:Faster R-CNN
AbstractRegion Proposal的计算是基于Region Proposal算法来假设物体位置的物体检测网络比如:SPPnet, Fast R-CNN运行时间的瓶颈。Faster R-CNN引入了Region Proposal Network(RPN)来和检测网络共享整个图片的卷积网络特征,因此使得region proposal几乎是cost free的。RPN->预测物体边界(o原创 2017-02-18 21:15:44 · 1738 阅读 · 0 评论 -
深度学习实践经验:用Faster R-CNN训练行人检测数据集Caltech——准备工作
前言Faster R-CNN是Ross Girshick大神在Fast R-CNN基础上提出的又一个更加快速、更高mAP的用于目标检测的深度学习框架,它对Fast R-CNN进行的最主要的优化就是在Region Proposal阶段,引入了Region Proposal Network (RPN)来进行Region Proposal,同时可以达到和检测网络共享整个图片的卷积网络特征的目标,使得reg原创 2017-02-18 21:16:35 · 19108 阅读 · 266 评论 -
深度学习实践经验:用Faster R-CNN训练Caltech数据集——修改读写接口
前言这部分主要讲如何修改Faster R-CNN的代码,来训练自己的数据集,首先确保你已经编译安装了py-faster-rcnn,并且准备好了数据集,具体可参考我上一篇文章。py-faster-rcnn文件结构caffe-fast-rcnn 这里是caffe框架目录,用来进行caffe编译安装data 用来存放pre trained模型,比如ImageNet上的,要训练的数据集以及读取文件的原创 2017-02-18 21:17:23 · 3760 阅读 · 3 评论 -
深度学习实践经验:用Faster R-CNN训练Caltech数据集——训练检测
前言前面已经介绍了如何准备数据集,以及如何修改数据集读写接口来操作数据集,接下来我来说明一下怎么来训练网络和之后的检测过程。修改模型文件faster rcnn有两种各种训练方式:Alternative training(alt-opt)Approximate joint training(end-to-end)两种方法有什么不同,可以参考我这篇博客,推荐使用第二种,因为第二种使用的显存更小,而原创 2017-02-18 21:18:00 · 7035 阅读 · 5 评论 -
深度学习论文笔记:YOLO
Abstract之前的物体检测的方法是使用分类器来进行检测。相反,本论文将对象检测作为空间分离的边界框和相关类概率的回归问题。本论文的YOLO模型能达到45fps的实时图像处理效果。Fast YOLO:小型的网络版本,可达到155fps。与目前的检测系统相比,YOLO会产生更多的定位错误,但是会更少的去在背景中产生false positive。IntroductionDPM: use原创 2017-02-18 21:20:36 · 4397 阅读 · 0 评论 -
深度学习论文笔记:YOLO9000
AbstractYOLO9000: a state-of-the-art, real-time 的目标检测系统,可以检测超过9000种的物体分类。本论文提出两个模型,YOLOv2和YOLO9000。YOLOv2: 是对YOLO改进后的提升模型。利用新颖的,多尺度训练的方法,YOLOv2模型可以在多种尺度上运行,在速度与准确性上更容易去trade off。YOLO9000: 是提出的一种原创 2017-02-18 21:21:18 · 1342 阅读 · 0 评论