faster rcnn
文章平均质量分 54
qq小小布丁
内向
展开
-
faster rcnn代码解读
参考链接:http://blog.csdn.net/zhangwenjie89/article/details/52012880faster rcnn中除开常规的神经网络部分之外,最终要的部分应该是数据的读取和组织,论文中提到的anchor的生成,以及如何使用这些anchor去进行loss的计算,pooling layer也是一个custom layer,, 但并不是本文的创新,在fast转载 2017-04-13 15:32:35 · 1236 阅读 · 0 评论 -
faster rcnn源码解读2
参考链接:http://lib.csdn.net/article/deeplearning/57865?knId=1726http://blog.csdn.net/iamzhangzhuping/article/category/6230157http://blog.csdn.net/u010668907/article/category/6237110具体训练转载 2017-04-13 17:01:28 · 2098 阅读 · 0 评论 -
faster rcnn 源码解读1
models/pascal_voc/ZF/faster_rcnn_alt_opt/stage1_rpn_train.pt下面需要注意的是rpn_cls_score层为每个位置的9个anchor做的只是bg/fg的二分类,而不管具体是fg的话属于那一类别,rpn阶段完成这个任务就够了,后面fast rcnn可以对region proposal进行细分和位置精修。#stage 1训练RPN转载 2017-04-13 16:47:19 · 1612 阅读 · 0 评论 -
faster-rcnn 安装
faster-rcnn提出论文: 《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》faster-rcnn 的算法详解可看这篇博文(清晰易懂,良心博文!): http://blog.csdn.net/shenxiaolu1984/article/details/51152614转载 2016-12-02 17:06:00 · 11288 阅读 · 4 评论 -
rcnn
参考:http://blog.csdn.net/shenxiaolu1984/article/details/51066975RCNN算法分为4个步骤 :1、一张图像生成1K~2K个候选区域 2、对每个候选区域,使用深度网络提取特征 3、特征送入每一类的SVM 分类器,判别是否属于该类 4、使用回归器精细修正候选框位置 1、一张图像生成1K~2K个候选区域转载 2016-12-26 16:29:38 · 492 阅读 · 0 评论 -
faster r-cnn训练问题集
1、出现问题:训练faster rcnn时出现如下报错:File "/py-faster-rcnn/tools/../lib/datasets/imdb.py", line 108, in append_flipped_images assert (boxes[:, 2] >= boxes[:, 0]).all()AssertionError问题分析:检查自己数据发现,左上角原创 2016-12-26 16:33:34 · 624 阅读 · 0 评论 -
Faster R-CNN代码讲解
最近开始学习深度学习,看了下Faster RCNN的代码,在学习的过程中也查阅了很多其他人写的博客,得到了很大的帮助,所以也打算把自己一些粗浅的理解记录下来,一是记录下自己的菜鸟学习之路,方便自己过后查阅,二来可以回馈网络。目前编程能力有限,且是第一次写博客,中间可能会有一些错误。目录目录第一步准备第二步Stage 1 RPN init from I转载 2017-04-06 20:52:19 · 6764 阅读 · 3 评论 -
faster rcnn训练
输入命令./experiments/scripts/faster_rcnn_alt_opt.sh 0 ZF pascal_vocfaster_rcnn_alt_opt.sh的训练代码如下:time ./tools/train_faster_rcnn_alt_opt.py --gpu ${GPU_ID} \ --net_name ${NET} \ --weights data原创 2017-04-07 16:32:14 · 1218 阅读 · 0 评论 -
faster rcnn 中pascal_voc.py
该部分代码功能在于实现了一个pascol _voc的类,该类继承自imdb,用于负责数据交互部分。初始化函数在初始化自身的同时,先调用了父类的初始化方法,将imdb _name传入,例如(‘voc _2007 _trainval’)下面是成员变量的初始化:{ year:’2007’ image _set:’trainval’ devkit _path:’原创 2017-04-07 18:46:53 · 2294 阅读 · 2 评论 -
faster rcnn中train.py
这是一个简单的solver包装类,主要是为了实现自己的snapshot,值得一提的地方不是太多,主要是为了读者从头到尾的训练过程理解更加连贯,所以为此文单独开一节源码分析。class SolverWrapper(object):"""A simple wrapper around Caffe's solver.This wrapper gives us control over he sn原创 2017-04-07 19:31:56 · 909 阅读 · 0 评论 -
faster rcnn中stage1_rpn_train.pt
参考链接:http://blog.csdn.net/sunyiyou9/article/details/52434541这部分主要介绍了通过Alternating Optimization是如何训练RPN网络的,它是怎么样的一个过程。算法过程如下图所示,M4模型是最终的输出。 在该训练过程中,主要分为两大主要的Stage——stage1和stage2。可以看到他的Prototx转载 2017-04-07 19:44:21 · 1846 阅读 · 0 评论 -
faster rcnn中创建数据
1构建自己的IMDB子类1.1文件概述可有看到datasets目录下主要有三个文件,分别是factory.pyimdb.pypascal_voc.pyfactory.py 是个工厂类,用类生成imdb类并且返回数据库共网络训练和测试使用;imdb.py 这里是数据库读写类的基类,分装了许多db的操作,但是具体的一些文件读写需要继承继续读写;pascal_voc.py R转载 2017-04-07 20:02:53 · 618 阅读 · 0 评论 -
faster rcnn 中anchor_target_layer.py
参考链接:http://blog.csdn.net/sunyiyou9/article/details/52264338本文介绍了在solver中出现的用Python定义的layer,顾名思义,该layer主要功能是产生anchor,并对anchor进行评分等操作,详细见代码注释。 class AnchorTargetLayer(caffe.Layer):"""Assign anc转载 2017-04-07 19:36:03 · 2393 阅读 · 0 评论