计算机视觉
文章平均质量分 71
计算机视觉
JoliceYU
技术小白 一步一个脚印 不断努力不断学习
展开
-
FasterRCNN训练自己数据记载
在将fasterrcnn的算法代码跑通了,尝试训练自己的数据,将自己的数据制作成VOC2007的格式即可。在这里主要参考小咸鱼的博客(http://blog.csdn.net/sinat_30071459/article/details/51332084),感谢大神。自己实际过程就是按照该博客一步步配置的,下面记录下自己配置中出现的一些问题。 1、Error:assert (boxes[:, 2]原创 2017-11-20 13:25:19 · 1399 阅读 · 0 评论 -
Mask-RCNN论文阅读笔记
一、摘要mask-rcnn本质上在fasterrcnn的基础上加了一个预测每个二值掩膜mask的分支,相当于在之前fasterrcnn的基础上,fasterrcnn将目标框出,maskrcnn在目标框内对目标做一个实例分割。整理思路如下: 在faster的基础上预测出了每个目标框,maskrcnn在框内对每个像素再进行预测,预测每个像素是否属于这个框所属的类别。eg:上图上,最大的那个框原创 2017-11-30 16:37:34 · 1821 阅读 · 0 评论 -
FasterRCNN在ubuntu下编译走过几个小坑
前语之前一直在window下编译基于matlab的fasterrcnn,一直没弄出来,无奈各种配置以及bug。转到跑python版本的代码,在linux下配置起来简单多了,主要是按照(https://github.com/rbgirshick/py-faster-rcnn)的步骤来的。注意注意1:在这里最好按照一步步的步骤来,有些文件最好的也是运行github上的一些sh文件,有时候自己在其他地方下原创 2017-11-19 21:22:58 · 2623 阅读 · 5 评论 -
Roi_Pooling层caffe源码解读
在看fasterrcnn以及和maskrcnn的时候,发现自己对fasterrcnn的roi_pooling层的原理还是不是很明白,之前只是知道roi_pooling是将rpn输出的一个roi的区域映射成一个固定大小的map,再送入后面的分类层进行分类。最近看了下roi_pooling层的源码,顿悟了。1、roi_pooling在proto中的定义根据看caffe源码的原则,先看该成在caffe.p原创 2017-12-01 10:51:29 · 2921 阅读 · 1 评论