![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Deep Learning
文章平均质量分 50
lanyuxuan100
这个作者很懒,什么都没留下…
展开
-
Tensorflow初次使用遇到scipy版本问题
今天在训练第一个Tensorflow程序时,提示如下错误:到提示出错的代码处一看,作者居然已经给出了错误解决办法:于是,安装作者提示进行如下升级:pip install --upgrade scipy果然问题解决了!原创 2017-04-07 19:30:11 · 3696 阅读 · 1 评论 -
Libgflags共享动态库出问题了
这两天在ubuntu14.04的环境中,由于gflags的错误安装导致caffe编译的时候出现如下错误: 这里涉及到gflags的安装,原来使用sudo apt-get install libgflags-dev 但是后面有人在环境中下载安装了libgflags的安装包,解压后直接安装: mkdir build cd build cmake .. make make test原创 2017-04-07 19:52:22 · 5908 阅读 · 0 评论 -
Libgflags共享动态库出问题了
这两天在ubuntu14.04的环境中,由于gflags的错误安装导致caffe编译的时候出现如下错误: 这里涉及到gflags的安装,原来使用sudo apt-get install libgflags-dev 但是后面有人在环境中下载安装了libgflags的安装包,解压后直接安装: mkdir build cd build cmake .. make make test原创 2017-04-07 19:53:12 · 715 阅读 · 0 评论 -
caffe编译提示opencv错误
在编译caffe的时候,提示如下的opencv错误: 这个错误其实在编译caffe的时候经常会有遇到,解决的办法非常简单,在Makefile.config中修改配置文件 这类小问题分享出来,希望给新手一些帮助。原创 2017-04-07 20:03:23 · 1931 阅读 · 0 评论 -
Tensorflow训练Kitti道路分割数据
大家学习一个深度学习架构,往往需要遵循如下步骤规律:(1)数据如何读取,如如何从图片和标签数据中读出成tensorflow可以使用的数据; (2)其次是如何搭建网络; (3)然后就是如何训练模型,保存模型,使用模型; (4)最后就是可视化了。 学习的资料可以参考github上的例程: http://blog.csdn.net/zhangxx0811/article/details/4320原创 2017-04-07 20:33:56 · 5560 阅读 · 7 评论 -
图像分割任务中的尺度问题
在图像的目标检测任务中,由于目标尺寸变化,需要在不同的尺寸下对目标进行检测,从而演化出许许多多解决目标检测任务中的尺度问题的方法,比如Fast-RCNN,及Faster-RCNN及后面的SSD,YOLO等网络。那么在场景解析任务中是否存在尺度问题呢?答案是肯定的。场景解析在这里确切地说是基于图像的像素级别的语义分割,不同尺寸的物体需要在不同的感受野范围内才能相对容易的将其与背景分割开来。那么如何原创 2017-04-17 20:43:43 · 8591 阅读 · 0 评论 -
Pyramid Scene Parsing Network(PSP NET)
背景由于场景的多样性与开放性,场景解析是一项十分复杂的任务。 在这篇文章中,我们探索一下通过叠加金字塔池化与金字塔场景解析来获取全局上下文信息的能力。 金字塔场景解析网络,在场景解析任务中表现良好,pyramid scene parsing network (PSPNet)提供了一种很好的像素级别分割的框架。#原创 2017-04-11 17:09:49 · 1756 阅读 · 0 评论 -
sift-flow数据集
图像语义分割与几何语义分割数据集下载该数据集:wget www.cs.unc.edu/~jtighe/Papers/ECCV10/siftflow/SiftFlowDataset.zip里面有2688张图像,其类别信息如下:Semantic and geometric segmentation classes for scenes.Semantic: 0 is原创 2017-04-18 14:59:14 · 5255 阅读 · 6 评论 -
Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: Python
在使用caffe的python层时经常容易出现如下错误:Check failed: registry.count(type) == 1 (0 vs. 1) Unknown layer type: Python 其原因是没有开启对python的支持,需要在Makefile.conf文件中开启如下开关:WITH_PYTHON_LAYER=1 然后再make && make py原创 2017-04-18 18:16:38 · 8287 阅读 · 7 评论 -
R-CNN阅读笔记
2014 年:R-CNN - 首次将 CNN 用于目标检测 输入:图像 输出:边界框+图像中每个目标的标注(即类别) 但是我们如何找出这些边界框的位置? R-CNN 做了我们也可以直观做到的——在图像中假设了一系列边界,看它们是否可以真的对应一个目标。 R-CNN 创造了这些边界框,或者区域提案(region proposal)关于这个被称为选择性搜索(Selective Search原创 2017-05-01 16:45:49 · 580 阅读 · 1 评论 -
SPP-NET阅读笔记
大神何凯明2014年的SPP-NET主要创新点在于提出了空间金字塔池化,在一定程度上解决了目标检测任务中的尺度变化问题,是后续各种尺度问题中金字塔结构的原型。Background在之前物体检测的文章,比如R-CNN中,他们都要求输入固定大小的图片,这些图片或者经过裁切(Crop)或者经过变形缩放(Warp),都在一定程度上导致图片信息的丢失和变形,限制了识别精确度。两种方式如下所示。 在网络原创 2017-05-01 18:24:27 · 708 阅读 · 0 评论 -
Fast-RCNN阅读笔记
2015年提出的 Fast R-CNN 主要贡献是加速和简化 R-CNN。 R-CNN因为下述原因运行很慢: 1,为每幅图像提取候选区域(selective search),得到平均约2000个候选区域,那么前向传播的过程就需要运行平均约2000次; 2, 它必须分别训练三个不同的模型 - CNN 生成图像特征,预测类别的分类器SVM和收紧边界框的回归模型。这使得整个流水线(pipeline)原创 2017-05-01 17:17:59 · 518 阅读 · 0 评论 -
Faster R-CNN阅读笔记
2016:Faster R-CNN—加速候选区域提取 背景:在 Fast R-CNN中,通过使用选择性搜索(selective search)提取候选区域,这是一个相当缓慢的过程,被认为是整个流程的瓶颈。 于是,少卿大神提出resion proposal network: 那么这里的候选区域是如何生成的呢?参看下图: 在CNN 的特征上滑动一个窗口,在每个窗口位置,网络在每个锚点输出一个原创 2017-05-01 18:00:48 · 640 阅读 · 0 评论 -
MASK-RCNN阅读笔记
2017:Mask R-CNN - 扩展 Faster R-CNN 以用于像素级分割背景何凯明的这篇大作是想像Fast/Faster-RCNN,FCN做为检测任务与分割任务的基础框架那样,将MASK-RCNN做为实例分割的基础框架。 由于既要求检测出图像中的每个物体,又要求分割出每一个实例,这里有可能一类物体同时出现多个实例,这样就会使问题的难度增加,因此实例分割是一项非常有挑战性的任务。 本文原创 2017-04-26 16:08:53 · 11496 阅读 · 1 评论 -
MultiNET环境搭建中Cython问题处理
在编译MultiNet时,出现如下问题:经调查是Cython版本问题,于是使用pip来升级Cython:sudo pip install runcython --upgrade结果如图所示:经验证,问题解决。原创 2017-04-06 20:48:59 · 809 阅读 · 0 评论 -
tensorboard启动不起来,提示端口被占用
早上来想可视化一下训练过程,结果一运行tensorboard,提示如下: 先ps了一下firefox,然后将使用这个浏览器的进程都关闭了,但还是不行。 于是,查看一下谁在占用这个端口: 将其kill掉,再次调用tensorboard就可以了。原创 2017-05-02 10:12:54 · 6138 阅读 · 0 评论 -
mask-rcnn的可视化网络结构
在tensorflow中训练mask-rcnn的程序,在COCO数据集上. https://github.com/CharlesShang/FastMaskRCNN.git使用tensorboard查看其网络结构如下:原创 2017-05-02 14:25:20 · 5649 阅读 · 2 评论 -
2017深度学习中的分割网络综述
论文《A Review on Deep Learning Techniques Applied to Semantic Segmentation》,深度学习技术在语义分割中的应用综述,包含28个数据集和27种方法。 链接: https://arxiv.org/abs/1704.06857原创 2017-05-10 18:31:23 · 1897 阅读 · 0 评论 -
车道线分割效果对比
run_2_lane_20170501.sh 对应的权重比例:60:1run_2_lane_20170502.sh 对应的权重比例:1:1 run_2_lane_20170503.sh 对应的权重比例:200:1 综上可见使用1:1的权重比例比其他倾向于车道线的权重比例效果更佳。 但是,是否可以再增加背景的权重比例呢?原创 2017-05-02 18:02:22 · 2519 阅读 · 2 评论 -
Mask-RCNN的主要贡献
mask-rcnn一举超越经过各种数据增强加持的2016年COCO的分割挑战赛冠军FCIS,分割结果与检测结果并行输出,结果令人印象深刻!原创 2017-05-03 14:06:46 · 2893 阅读 · 0 评论 -
Caffe FCN Test | Check failed: error == cudaSuccess (2 vs. 0) out of memory
在使用caffe跑FCN测试的时候,提示如下错误: Check failed: error == cudaSuccess (2 vs. 0) out of memory 是内存溢出,而且是cuda报出的,那么就是gpu的缓存溢出了。 遇到这种情况,首先要看的就是训练与测试的batch_size了,而训练过程没有问题,说明训练的batch_size没有问题; 测试过程出现的这个问题,查看的f原创 2017-04-21 10:15:45 · 4389 阅读 · 13 评论 -
快速生成训练样本与标签样本之间的索引文件
我们经常在训练的时候会用到将训练文件与标签文件对应起来的索引文件,如下格式: 这个索引有两部分组成:训练文件+空格+标签文件 本文使用先分别生成训练文件索引、标签文件索引,再将两部分合成的方法,灵活且高效地生成训练样本与标签样本之间的索引文件。(1)训练与标签索引生成可以使用matlab文件生成 %批量生成文件名主函数clc,clear,close all;SrcPath = 'C:原创 2017-04-21 11:05:25 · 1512 阅读 · 0 评论 -
Mask-RCNN中的ROIAlign, ROIPooling及ROIWarp对比
RoI Pooling实现从原图ROI区域映射到卷积区域最后pooling到固定大小的功能,然后通过池化把该区域的尺寸归一化成卷积网络输入的尺寸。ROIAlign上面RoI Pooling从原图ROI映射到卷积区域,即原图ROI与特征图ROI之间的映射,使用了stride间隔的取整,使得特征图ROI再映射回原图ROI的时候有stride的误差。尤其经过最大值池化后的特征与原ROI之间的空间不对齐就更原创 2017-05-03 16:05:34 · 20344 阅读 · 1 评论 -
Linux下使用du查看文件夹大小
训练程序时总容易出现home下磁盘已满,于是想看下各个文件夹占用空间情况,查了下使用如下命令是比较理想的:du -ah --max-depth=1原创 2017-04-21 11:36:14 · 486 阅读 · 0 评论 -
使用Tensorflow训练自己的分割数据
数据准备首先,需要将准备好的原始数据与其标签文件放在固定目录下,然后建立标签索引文件train.txt与val.txt,具体格式如图所示,左侧是原图,右侧是标签图:然后建立test.txt文件,具体如图所示: 设计网络结构比如使用FCN的机制来进行分割,以下面的网络结构为例:修改配置文件比如本次训练使用高速的数据,将训练配置文件hypes/KittiSeg_highspeed.json中的data原创 2017-04-11 10:26:01 · 6502 阅读 · 5 评论 -
Tensorflow指定使用哪个GPU
在多卡机器上训练的时候,经常会需要指定tensorflow程序跑在固定的GPU上,于是就有了如下手段:export CUDA_VISIBLE_DEVICES=2,3指定我们的程序只能看到GPU中序号为2与3的设备,于是启动后就可以看到: 我们的训练程序进程号是27088,可以看到它只跑在了2与3显卡上。原创 2017-04-21 13:02:08 · 6588 阅读 · 0 评论 -
Tensorflow中遇到OOM when allocating tensor
在使用tensorflow训练程序的时候,遇到了如下错误: 这表明内存溢出,在查看发现有另外一个训练程序与之争抢资源,停掉,在重新给训练任务分配GPU,避免争抢,问题解决。原创 2017-04-21 13:10:10 · 23897 阅读 · 3 评论 -
R-FCN阅读笔记
一个base的conv网络如ResNet101, 一个RPN(Faster RCNN来的),一个position sensitive的prediction层,最后的ROI pooling+投票的决策层,如下图: ideaposition sensitive score map分类需要特征具有平移不变性,检测则要求对目标的平移做出准确响应。现在的大部分CNN在分类上可以做的很好,但用在检测上效果不佳原创 2017-05-04 11:18:41 · 754 阅读 · 0 评论 -
深度学习目标检测算法性能分析
参考如下论文2017年最新版: Speed/accuracy trade-offs for modern convolutional object detectors 本文的目的就是在给定设备与平台的前提下,帮助选择一个合适的检测框架,能够实现速度、准确度、内存的多方面平衡。Google Research搭建了三种通用检测框架:Faster R-CNN, R-FCN and SSD,近几年目标检原创 2017-05-04 09:28:35 · 3466 阅读 · 1 评论 -
使用TF-Slim:在TensorFlow中定义复杂模型的高层库
谷歌发布了一个新的TensorFlow图像识别库 ——Slim。TF-Slim是TensorFlow的一款轻量级的生成、训练和评估模型的工具库,很容易上手使用。自发布以来,TF-Slim 已经得到长足发展,无论是网络层、代价函数,还是评估标准,都增加了很多类型,训练和评估模型也有了很多便利的常规操作手段。 这些手段使你在并行读取数据或者在多台机器上部署模型等大规模运行时,不必为细节操心。 此外,原创 2017-04-22 11:00:42 · 1278 阅读 · 0 评论 -
Tensorflow找不到cuda的库
在安装完tensorflow后,进行测试,发现找不到cuda的库: 发现在cuda的安装目录/usr/local/cuda-8.0/lib64中有,而在系统的库目录/usr/local/lib下没有: 于是进行拷贝:sudo cp /usr/local/cuda-8.0/lib64/libcudart.so* /usr/local/lib/sudo ldconfig于是,问题解决。原创 2017-04-22 16:48:34 · 2253 阅读 · 0 评论 -
ValueError: need more than 1 value to unpack
在执行如下图中所示代码时出现标题中的错误: 于是查看了文件,看看是不是文件内容出错了: 这样替换了内容,猜测是不是因为00000这个开头呢,于是换成下面就过了:原创 2017-04-23 16:36:33 · 4345 阅读 · 0 评论 -
目标检测网络发展历程从R-CNN到Faster-RCNN
2014年的R-CNN主要步骤如下: 1. 预先生成目标候选区域。 2. 使用CNN提取目标候选区域中的特征,通过分类器(SVM)查看类别。 3. 线性回归出目标的精确位置。2015年的Fast-RCNN的主要步骤如下:原创 2017-05-01 16:50:40 · 2410 阅读 · 1 评论 -
全卷积网络FCN的缺陷
its inherent spatial invariance does not take into account useful global context information FCN没有考虑全局上下文信息; 且分割不是实例级别的; 效率也不够实时; 不完全适用于非结构化数据,例如三维点云等;原创 2017-05-14 08:27:54 · 3827 阅读 · 0 评论 -
FCN解码器与SegNet解码器的区别
如上图所示,SegNet解码器是使用编码器中max pooling对应的upsample,换句话说说,其对应关系是记住的; 而FCN的解码器是Deconvolution,是学习得到的解码器,更加灵活。原创 2017-05-14 08:38:00 · 2556 阅读 · 2 评论 -
Tensorflow训练CNN网络识别mnist
-- coding: utf-8 --“”” Created on Sun April 09 13:17:30 2017@author: Zizhang Wu “”“#数据加载import input_data mnist = input_data.read_data_sets(“MNIST_data/”, one_hot=True)import tensorflow as tf sess原创 2017-04-09 17:32:11 · 672 阅读 · 2 评论 -
深度学习革命性成果
Lifelong-DNN 克服了神经网络的灾难性遗忘问题,今年第三季度发售,还没公布技术细节。 Neurala 的待决专利软件 Lifelong-DNN™(Lifelong-Deep Neural Networks) 克服了神经网络的灾难性遗忘问题,这是限制神经网络实时使用的一大问题。Neurala 昨日宣布在深度学习软件方面取得重大进展,其软件的学习过程可以使用或不使用云,并消除了遗忘以前学原创 2017-05-14 09:13:32 · 608 阅读 · 0 评论 -
获取上下文信息的方法
分割网络为了充分考虑上下文信息,以解决感受野尺度的问题,分别采用如下手段: (1) 特征融合,以Parse Net, Sharp Mask为代表; (2) Dilated Convolutions, 以ENet为代表; (3) 多尺度预测,以Multi-scale CNN-Eigen, PSP Net等为代表; (4) 条件随机场,以DeepLab, CRFasRNN, MINC-CNN等为原创 2017-05-14 08:49:24 · 2114 阅读 · 0 评论 -
多尺度特征融合
CNN网络的每一个参数,几乎都会影响到产生的特征图。 这隐含着固定架构的网络,往往会学习到特定尺度的特征,也可能具有了一定的尺度不变性。 同时,这些参数往往与当前的任务紧密相关,不能轻易修改,于是使得模型很难学到多尺度的信息; 一种克服该问题的方法就是使用多尺度网络结构。,这种网络结构在设计之初就考虑学习不同尺度的特征,然后将不同尺度特征的预测结果进行融合,得到最终的输出。原创 2017-05-14 10:26:28 · 17401 阅读 · 0 评论 -
使用Tensorflow测试自己的分割网络模型
测试数据准备首先,将没有训练过的数据放在一定路径下,以便后面测试使用: 修改测试脚本如下图所示,需要修改测试脚本中的两个指定模型文件的位置: 执行测试命令python demo.py –gpus 0 –input data/test/000519.bmp后续准备将这个测试脚本修改一下,使其能批量测试图片。 测试结果如下所示: 测试效果分析原图:分割图:原图:分割图:原图:分割图:原图:分割图原创 2017-04-11 10:46:12 · 2420 阅读 · 1 评论