2017年12月_lanyuxuan100

原创 pycaffe上复现mask-rcnn

最近在pycaffe上复现mask-rcnn，发现训练后，测试的结果比较奇怪，虽然mask的loss分支下降了，但是从结果上看，好像没有学到：保存下来的28*28的mask小图如下：而其mask label是各位路过的大神多多指点一下，谢谢！

2017-12-29 20:18:15 2413 2

原创已安装opencv的环境中，python import 提升no nodule named cv2

这个问题遇到很多次了，但还是总忘记怎么解决，其实比较简单的办法就是直接安装python-opencv。apt-get install python-opencv就ok了。

2017-12-28 15:48:54 715

原创 scipy.misc.imresize隐藏归一化到0-255区间的操作

最近在使用scipy.misc.imresize函数时，发现其内部有自动除以255的操作，不知情的情况下调用这个方法会使得结果的值域发生变化。比如，本人的如下代码：iTemp_Mask = np.round(scipy.misc.imresize(iTemp.astype(float),(new_size,new_size), interp='nearest') / 255.0).asty

2017-12-27 19:44:00 2913 1

转载【转】Deformable ConvNets论文笔记

转自：http://m.blog.csdn.net/yucicheung/article/details/781138432.1 Deformable Convolution 2D的卷积包括两个步骤：1)用一个规则的网格R在输入特征图上进行采样；2)对于采样的值用w进行加权再求和。网格R定义了感受野大小和扩张量。比如R={(−1,−1),(−1,0),…,(0,1),(1,1)

2017-12-27 10:20:56 381

转载【转】ROI Align 在 R-FCN 中的推广：Position Sensitive ROI Align

转自：http://blog.leanote.com/post/afanti.deng@gmail.com/Position-Sensitive1. Position Sensitive ROI-Pooling 简介　　Position Sensitive ROI Pooling（位置敏感的候选区域池化）是检测框架R-FCN的主要创新点。一般来讲，网络越深，其具有的平移旋转不变性越

2017-12-27 10:15:42 2050

原创训练mask-rcnn时报错，RuntimeWarning: overflow encountered in exp

在py-faster-rcnn的基础上修改为mask-rcnn的过程中，遇到很多问题，其中训练的时候报exp的溢出错误。该错误是因为mask分支的loss过大，在同faster-rcnn共享同一个学习率的时候，梯度回传过大，导致梯度爆炸，进而出现溢出错误。在faster-rcnn的bbox_transform.py第48行就容易出现该类错误。解决办法是降低mask分支的lo

2017-12-26 10:27:39 10685 5

原创 caffe中如何设置某层不参与反向传播

在编写caffe某些层的时候，需要设置其不进行反向传播，否则会有类似如下的错误：主要有两种方法解决：（1）如果是C++写的层，直接在prototxt中层参数设置的时候，添加如下参数即可：lr mult:0decay mult:0（2）另外可以在loss 层的定义中增加如下参数即可： propagate_down: 1 propagate_down: 0

2017-12-23 18:39:48 3436 2

转载【转】data augmentation 数据增强方法总结

转自：http://blog.csdn.net/u010555688/article/details/607579321、问题描述收集数据准备微调深度学习模型时，经常会遇到某些分类数据严重不足的情况，另外数据集过小容易造成模型的过拟合。本文参考一些网友对于数据增强方法的一些tips，后续会附上自己实现的C++代码；2、data augmentation常用方法

2017-12-22 16:24:19 4197 1

转载【转】目标检测-- DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling

转自：http://blog.csdn.net/zhangjunhit/article/details/77847873DeNet: Scalable Real-time Object Detection with Directed Sparse Sampling ICCV2017An easily extendedTheanobased code： https://githu

2017-12-22 13:09:24 1028 1

转载【转】R-FCN

转自：http://blog.csdn.net/duinodu/article/details/69790844RFCN是基于Faster RCNN的工作，base net得到feature maps, 用RPN得到proposals。由于classification需要固定长度的feature vector，就需要ROI pooling layer + fully connected

2017-12-22 11:15:38 372 1

转载【转】Faster-R-CNN（Python）.2：COCO数据集annotation内容

转自：http://blog.csdn.net/qq_30401249/article/details/72636414因为很多内容都是重复的，所以只截取了部分内容。instances_train2014.jsoninstances_val2014.json{"info": {"description": "This is stable 1.0 version of the 2

2017-12-20 16:52:39 1259

原创 caffe中添加新的网络层的步骤

（1 ）src实现（2）include头文件（3）test测试文件（4）proto注册该层

2017-12-20 15:25:35 402

转载【转】旷视科技Face++公开COCO2017冠军模型

转自：http://www.chinaz.com/news/2017/1204/834503.shtml今年 ICCV2017 会议期间，COCO +Places2017 挑战赛公布了获奖榜单。在COCO Challenge 和 Places Challenge 两个板块的七项比赛中，旷视科技（Face++）拿下了 COCO Detection/Segmentation Challenge

2017-12-20 11:13:26 2030

原创 Mask-rcnn数据准备

mask-rcnn数据出来流程：main()： -----------------load_coco():----加载标签数据标号、图像标号、类别标号及相互映射关系 -----------------prepare():---- 准备数据类别 -----------------train():----

2017-12-19 09:49:01 769

原创 Faster-rcnn数据准备过程

mask-rcnn数据出来流程：main()： -----------------load_coco():----加载标签数据标号、图像标号、类别标号及相互映射关系 -----------------prepare():---- 准备数据类别 -----------------train():----

2017-12-18 15:49:59 464

转载【转】贾佳亚港中文团队冠军技术分享：最有效的COCO物体分割算法

转自：http://www.sohu.com/a/201822261_473283【新智元导读】物体分割（instance segmentation）是如今视觉领域最热最核心的一个问题。在这届国际图像识别权威竞赛MS COCO当中，香港中文大学团队UCenter取得了物体分割任务第一名，相对去年的冠军，团队取得了9.1个点的提升，相对提升达24%。他们通过深度剖析FPN、Mask R-CN

2017-12-18 11:05:11 1266

转载【转】ShuffleNet算法详解

转自：http://m.blog.csdn.net/u014380165/article/details/75137111论文：ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices论文链接：https://arxiv.org/abs/1707.01083算法详解：

2017-12-14 14:28:10 421

转载【转】ShuffleNet

转自：http://blog.csdn.net/shuzfan/article/details/77141425本文介绍旷视科技最近提出来的ShuffleNet, 目的同样也是利用特殊的网络结构达到参数少速度快的效果。文章链接：《ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile

2017-12-14 14:19:56 925

原创 numpy版本不兼容问题解决办法

TypeError: 'numpy.float64' object cannot be interpreted as an index这里是因为numpy版本不兼容导致的问题，最好的解决办法是卸载你的numpy，安装numpy1.11.0。如果你和笔者一样不是服务器的网管，没有权限的话，就只能自己想办法解决了。修改如下几个地方的code：1) /home/xxx/py

2017-12-13 21:43:15 16265

转载【转】检测数据集分析VOC+COCO_RGBD

转自：http://blog.csdn.net/yuanluolvge/article/details/77989606VOC数据集:(包含5个文件夹)JPEGImages包含PASCAL VOC所提供的所有图片信息,包括训练图片和测试图片,以"年份_编号.jpg"格式命名.横向图尺寸大约在500*375左右,纵向图尺寸大约在375*500左右,基本偏差不会超过100,因为训练的第一步

2017-12-13 20:16:53 1191

原创 Faster-rcnn中的问题解惑

今天在王同学的帮助下，解决了Faster-rcnn中的一个重大解惑，就是下面ROI pooling后，是一张ROI图传给下面的模块进行分类与边界回归。经查看代码：发现在ROI pooling层，循环对每一个ROI区域都进行了后面的分类与边界回归的任务，这样就解释得通了。这个是在目标检测流程中经常遇到的，取多个候选区域，后面的模块其实被循环调用。

2017-12-12 17:21:40 372

转载【转】Faster RCNN原理分析（二）：Region Proposal Networks详解

转自：http://lib.csdn.net/article/deeplearning/61641Region Proposal Networks是Faster RCNN出新提出来的proposal生成网络。其替代了之前RCNN和Fast RCNN中的selective search方法，将所有内容整合在一个网络中，大大提高了检测速度（语文水平差，所以历史科普请看其他文章T_T）。缩进

2017-12-12 15:44:02 3306 1

转载【转】Faster RCNN代码理解（Python）

目录目录第一步准备第二步Stage 1 RPN init from ImageNet model在config参数的基础上改动参数以适合当前任务主要有初始化化caffe准备roidb和imdb设置输出路径output_dir get_output_dirimdb函数在config中用来保存中间生成的caffemodule等正式开始训练保存最后得到的权重参数第三步Stage 1 RPN gene

2017-12-12 15:37:55 917

转载【转】Mask-RCNN技术解析

转自：http://blog.csdn.net/linolzhang/article/details/71774168一. Mask-RCNN 介绍上篇文章介绍了 FCN，这篇文章引入个新的概念 Mask-RCNN，看着比较好理解哈，就是在 RCNN 的基础上添加 Mask。 Mask-RCNN 来自于年轻有为的 Kaiming 大神，通过在 Fast

2017-12-12 09:48:12 720

转载【转】mask-rcnn详解

《Mask R-CNN》进行实例分割，就是要在每一个像素上都表示出来目标所属的具体类别。完成类别检测，图像分割和特征点定位。 1、解决的问题：在时间上对faster rcnn进行了优化，并且提高准确度，最关键的是在像素级别进行特征点定位达到了将各个对象的边缘确定的效果。上图是，faster rcnn的分割检测效果。下图是，mask rcnn的分割检测效果，可以明显看到，改进的

2017-12-12 09:39:49 5738

原创分割问题中“类间竞争”是怎么回事

softmax会返回多种不同类别；而sigmoid会得到二值结果softmax的值域是[0,1]sigmoid的值域是[0,1]sigmoid可以看成是softmax的两类分类的特例

2017-12-11 17:04:59 822 1

转载 matterport MASK RCNN配置

本文转自：http://blog.csdn.net/zpp13hao1/article/details/786649942017.11.29GitHub地址：https://github.com/matterport/Mask_RCNN首先表达一下对凯明大神和RBG大神的膜拜！1.我是在Ubuntu16.04的环境下，开辟了一个虚拟环境，1.1

2017-12-11 16:23:11 1981 2

原创从RCNN，Fast-RCNN到Fater-RCNN的演化过程

RCNN将特征提取、分类、回归任务交给了CNN来做；Fast-RCNN在RCNN的基础上，增加了ROI pooling，注意这里的proposal还是外部提取出来的。Fast R-CNN的处理流程如上图所示：（1）使用CNN网络提取底层特征（这些特征是整幅图像上所有的Proposal公用的，节省了R-CNN中的计算量）；（2）自己写了一个ROI Pooling层，从数据层得到ROI

2017-12-11 08:16:53 1013

转载 faster-rcnn 之 RPN网络的结构解析以及RPN代码详解

【首先】：大家应该要了解卷积神经网络的连接方式，卷积核的维度，反向传播时是如何灵活的插入一层；这里我推荐一份资料，真是写的非常清晰，就是MatConvet的用户手册，这个框架底层借用的是caffe的算法，所以他们的数据结构，网络层的连接方式都是一样的；建议读者看看，很快的；下载链接：点击打开链接【前面5层】：作者RPN网络前面的5层借用的是ZF网络，这个网络的结构图我截个图放在下面

2017-12-11 08:04:37 2980

转载【目标检测】Faster RCNN算法详解

本文转自：http://blog.csdn.net/shenxiaolu1984/article/details/51152614Ren, Shaoqing, et al. “Faster R-CNN: Towards real-time object detection with region proposal networks.” Advances in Neural Info

2017-12-11 07:31:41 405

原创多任务网络训练技巧

从Faster-rcnn网络中可以看出，其有对候选框分类为前景与背景的任务，也有对候选框边界进行精修的回归任务，但是在这之前，是rpn网络与fast-rcnn的联合训练：区域生成网络（RPN）和fast RCNN都需要一个原始特征提取网络（下图灰色方框）。这个网络使用ImageNet的分类库得到初始参数W0，但要如何精调参数，使其同时满足两方的需求呢？本文讲解了三种方法。轮流训

2017-12-11 07:28:24 3367

原创 mask-rcnn扩展

由Faster-rcnn到mask-rcnn，即Faster-rcnn到Faster-rcnn-mask；由ssd到ssd-3d，再到ssd-3d-mask；由MV3D到MV3D-MASK；目前这些工作都是可以进行的，从caffe中的Faster-rcnn中ROI pooling转换为ROI Algin即可。

2017-12-11 07:02:01 801

转载如何用Soft-NMS实现目标检测并提升准确率

用一行代码提升目标检测准确率论文摘要非最大抑制（Non-maximum suppression, NMS）是物体检测流程中重要的组成部分。它首先基于物体检测分数产生检测框，分数最高的检测框M被选中，其他与被选中检测框有明显重叠的检测框被抑制。该过程被不断递归的应用于其余检测框。根据算法的设计，如果一个物体处于预设的重叠阈值之内，可能会导致检测不到该待检测物体。因此，我们提出了Sof

2017-12-10 21:41:17 14438 2

原创 Flexible NMS

Flexible NMS方法如下：1）对于置信度最高的边界框，将其与iou> 0.8的所有其他类似框组合，框的位置作为具有置信度权重的边界框位置的加权平均值。2）对于组合框的置信度，我使用conf = sum（最多N个边界框）/ N。这对组合多个结果特别有用，我还想惩罚那些只有单个网络找到的一个结果（相比更多网络/边界框预测的置信度更高的结果）。我使用N == 4 ×预测数的组合。

2017-12-10 21:00:52 626 1

原创 PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

目前看，在KITTI三维目标检测中，F-PointNet排名第一。这篇文章是2017年CVPR上的，讲的是根据点云信息直接进行三维的分类与分割。从效果上看，居然比陈晓智的MV3D还要好，真的不可思议。后面仔细看看内容再完善这篇博客。

2017-12-10 16:44:41 3482

原创 Keras使用初体验

最近使用Keras与Tensorflow来进行复现mask-rcnn的工作，主要在测试环节。Keras的backend使用的是Tensorflow，据说使用Keras封装会慢一些，到底慢多少不清楚，有待实验验证；既然是使用python进行的封装，后期使用的时候，可以对其进行去Keras。

2017-12-08 16:38:42 445

lanyuxuan100的博客