- 博客(237)
- 收藏
- 关注
原创 py-faster-rcnn详解(4)——anchor_target_layer.py接口说明
anchor_target_layer.py主要功能是产生anchor,并对anchor进行评分等操作
2017-06-08 20:33:07 1796
原创 py-faster-rcnn详解(2)——pascal _voc.py接口说明
imdb对象是一个pascol _voc的类实例,该类继承自imdb,用于数据交互。
2017-06-07 21:44:36 1679
原创 py-faster-rcnn详解(1)——train_faster_rcnn_alt_opt.py接口说明
py-faster-rcnn使用experiments/scripts/faster_rcnn_alt_opt.sh脚本启动训练过程。在faster_rcnn_alt_opt.sh脚本中,调用tools/train_faster_rcnn_alt_opt.py接口
2017-06-07 21:36:09 1647
原创 py-faster-rcnn训练自己数据集需要修改的参数
faster rcnn默认有三种网络模型 ZF(小)、VGG_CNN_M_1024(中)、VGG16 (大)
2017-06-06 22:03:31 4236
原创 训练faster rcnn的软硬件要求
faster rcnn默认有三种网络模型 ZF(小)、VGG_CNN_M_1024(中)、VGG16 (大)
2017-06-06 21:54:51 2200
原创 ubuntu使用watch命令实时监测显卡
Nvidia自带了一个 nvidia-smi的命令行工具,会显示显存使用情况,结合watch命令就可以实时监测显卡使用情况。
2017-06-04 20:44:23 24175 1
转载 SSD: Single Shot MultiBox Detector的安装配置和运行
SSD(Single Shot MultiBox Detector)算是一个比较不错的目标检测算法,主攻方向是速度,当然精度也比Yolo提高了一些
2017-05-23 10:54:50 1223
转载 Windows10 64位下安装TensorFlow
确认显卡支持 CUDA。确保Python版本是3.5 64位。确保稳定的网络连接。确保pip版本 >= 8.1。用 pip -V 查看当前 pip 版本,用 python -m pip install -U pip 升级pip 。确保安装了 VS2015 或者 2013 或者 2010。
2017-05-17 14:51:51 744 1
转载 走近人脸检测(4)——传统人脸检测技术和 CNN 的结合
能否将传统的人脸检测技术和深度网络(如CNN)相结合,在保证检测速度的情况下进一步提升精度?
2017-05-10 10:56:23 2827
转载 走近人脸检测(3)——R-CNN 系列
在2013年底,深度学习给目标检测任务点起了一把火,这个火种就是R-CNN,其中R对应于“Region(区域)”,意指CNN以图像区域作为输入,这个工作最终发展成了一个系列,也启发和衍生出了大量的后续工作,这一场大火简直烧红了计算机视觉领域的半边天。
2017-05-10 10:54:44 4290
转载 走近人脸检测(2)——VJ人脸检测器及其发展
人脸检测技术的突破发生在2001年,两位杰出的科研工作者Paul Viola和Michael Jones设计了出了一个快速而准确的人脸检测器:在获得相同甚至更好准确度的同时,速度提升了几十上百倍——在当时的硬件条件下达到了每秒处理15张图像的速度,已经接近实时速度25fps(即25帧每秒)。
2017-05-10 10:52:07 10540 3
转载 走近人脸检测(1)——基本流程
人脸检测的任务就是判断给定的图像上是否存在人脸,如果人脸存在,就给出全部人脸所处的位置及其大小。由于人脸检测在实际应用中的重要意义,早在上世纪70年代就已经有人开始研究,然而受当时落后的技术条件和有限的需求所影响,直到上世纪90年代,人脸检测技术才开始加快向前发展的脚步,在新世纪到来前的最后十年间,涌现出了大量关于人脸检测的研究工作,这时期设计的很多人脸检测器已经有了现代人脸检测技术的影子,例如可
2017-05-10 10:49:25 14122 5
转载 Caffe2和Caffe有何不同?
目前Caffe2还不能完全替代Caffe,还缺不少东西,例如CuDNN。与Caffe2相比,Caffe仍然是主要的稳定版本,在生产环境中使用仍然推荐Caffe
2017-04-21 15:16:43 26471 1
转载 Caffe源码解析7:Pooling_Layer
Pooling 层一般在网络中是跟在Conv卷积层之后,做采样操作,其实是为了进一步缩小feature map,同时也能增大神经元的视野。在Caffe中,pooling层属于vision_layer的一部分,其相关的定义也在vision_layer.hpp的头文件中。Pooling层的相关操作比较少,在Caffe的自带模式下只有Max pooling和Average poooling两种
2017-04-21 14:51:01 735
转载 Caffe源码解析6:Neuron_Layer
NeuronLayer,顾名思义这里就是神经元,激活函数的相应层。我们知道在blob进入激活函数之前和之后他的size是不会变的,而且激活值也就是输出 yy 只依赖于相应的输入 xx。在Caffe里面所有的layer的实现都放在src文件夹下的layer文件夹中,基本上很多文章里应用到的layer类型它都有cpu和cuda的实现。
2017-04-21 14:50:03 997
转载 Caffe源码解析5:Conv_Layer
Vision_layer里面主要是包括了一些关于一些视觉上的操作,比如卷积、反卷积、池化等等。这里的类跟data layer一样好很多种继承关系。
2017-04-21 14:49:05 685
转载 Caffe源码解析3:Layer
ayer这个类可以说是里面最终的一个基本类了,深度网络呢就是一层一层的layer,相互之间通过blob传输数据连接起来。首先layer必须要实现一个forward function,前递函数当然功能可以自己定义啦,在forward中呢他会从input也就是Layer的bottom,对了caffe里面网络的前一层是叫bottom的,从bottom中获取blob,并且计算输出的Blob,当然他们也会实现一个反向传播,根据他们的input的blob以及output blob的error gradient 梯度误差
2017-04-21 14:46:50 433
转载 Caffe源码解析2:SycedMem
看到SyncedMem就知道,这是在做内存同步的操作。这类个类的代码比较少,但是作用是非常明显的。文件对应着syncedmem.hpp,着syncedmem.cpp
2017-04-21 14:45:30 533
转载 Caffe源码解析1:Blob
Blob是作为Caffe中数据流通的一个基本类,网络各层之间的数据是通过Blob来传递的。这里整个代码是非常规范的,基本上条件编译,命名空间,模板类,各种不太经常看到的关键字如exlicit,inline等等。
2017-04-21 14:43:00 738
原创 深度学习——训练过程
2006年,Hinton提出了在非监督数据上建立多层神经网络的一个有效方法,该方法分为两步,一是每次训练一层网络,二是调优,使原始表示x向上生成的高级表示r和该高级表示r向下生成的x'尽可能一致:1、首先逐层构建单层神经元,这样每次都是训练一个单层网络。2、当所有层训练完后,Hinton使用wake-sleep算法进行调优。
2017-04-19 14:13:51 17673
原创 深度学习——核心思想
深度学习的思想就是堆叠多个层,也就是说这一层的输出作为下一层的输入。通过这种方式实现对输入信息进行分级表达了。深度学习是无监督学习的一种。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
2017-04-19 14:12:30 7070
转载 FastRCNN 训练自己数据集(二)——修改读写接口
读取接口的所有内容,主要步骤是:复制pascal_voc,改名字,修改GroundTruth和OP预选框的读取方式修改factory.py,修改数据库路径和获得方式__init__.py添加上改完的py文件
2017-04-19 11:33:00 1883 1
转载 FastRCNN 训练自己数据集(一)——编译配置
如何安装Fast RCNN环境,具体的流程在Ross Girshick的Github上有,他里面主要是讲解了如何安装和使用。我会稍微提到这一部分内容,主要讲解,如果要训练自己的数据,应该修改那些地方,并把我自己训练的过程跟大家分享一下。
2017-04-19 11:29:15 2870
转载 深度学习——通俗理解卷积神经网络
在dl中,有一个很重要的概念,就是卷积神经网络CNN,基本是入门dl必须搞懂的东西。本文基本根据斯坦福的机器学习公开课、cs231n、与七月在线寒老师讲的5月dl班第4次课CNN与常用框架视频所写,是一篇课程笔记。
2017-04-19 11:21:22 3602
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人