自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

转载 深度学习中的软件加速算法

深度学习算法对于人工智能的推动作用不言而喻,但其对计算力的要求也显而易见。如何使其运行更高效是摆在不少工程师面前的难题,通常他们会在代码中直接采用一个比较成熟的矩阵运算数学库,开源项目OpenBLAS就成了几个深度学习框架最依赖的库之一。现在, OpenBLAS的团队成员创业,创办了澎峰科技,主要目标是解决人工智能里面的计算性能问题,提供嵌入式系统和服务器云端的高性能框架和库,帮助人工智能和其

2017-09-14 09:47:05 2170

转载 基于深度学习的目标检测

普通的深度学习监督算法主要是用来做分类,如图1(1)所示,分类的目标是要识别出图中所示是一只猫。而在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)竞赛以及实际的应用中,还包括目标定位和目标检测等任务。其中目标定位是不仅仅要识别出来是什么物体(即分类),而且还要预测物体的位置,位置一般用边框(bounding box)标记,如图1(

2017-08-22 16:43:50 514

转载 py-faster-rcnn(running the demo): ubuntu14.04+caffe+cuda7.5+cudnn5.1.3+python2.7环境搭建记录

第一次写博客,以此纪念这几天安装caffe,跑faster-rcnn的血泪史.在此特别感谢网络各路大神,来自全球各地,让我能从中汲取营养,吸取经验,总结规律.faster-rcnn分为matlab版本和python版本,首先记录弄python版本的环境搭建过程.matlab版本见另一篇:faster-rcnn(testing): ubuntu14.04+caffe+cuda7.5+cudn

2017-08-22 11:34:45 381

转载 Caffe 学习:Eltwise层

Eltwise层的操作有三个:product(点乘), sum(相加减) 和 max(取大值),其中sum是默认操作。   假设输入(bottom)为A和B,如果要实现element_wise的A+B,即A和B的对应元素相加,prototxt文件如下:layer { name: "eltwise_layer" type: "Eltwise" bottom: "A"

2017-05-13 11:05:58 765

转载 caffe︱深度学习参数调优杂记+caffe训练时的问题+dropout/batch Normalization

一、深度学习中常用的调节参数1、学习率步长的选择:你走的距离长短,越短当然不会错过,但是耗时间。步长的选择比较麻烦。步长越小,越容易得到局部最优化(到了比较大的山谷,就出不去了),而大了会全局最优一般来说,前1000步,很大,0.1;到了后面,迭代次数增高,下降0.01,再多,然后再小一些。 2、权重梯度消失的情况,就是当数值接近于正向∞,求导之后就更小的,

2017-05-11 15:11:31 1969

原创 colour_recognition使用总结

1、激活函数的作用:使特征值变为y=f(x)形式2、num_output最后一个是表示分类的种类

2017-05-10 19:17:45 343

转载 Caffe学习系列(11):图像数据转换成db(leveldb/lmdb)文件

在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致。而在caffe中经常使用的数据类型是lmdb或leveldb,因此就产生了这样的一个问题:如何从原始图片文件转换成caffe中能够运行的db(leveldb/lmdb)文件?在caffe中,作者为我们提供了这样一个文件:convert_imageset.cpp,存

2017-03-03 16:42:14 553

转载 热成像原理

热成像是通过非接触探测红外能量(热量),并将其转换为电信号,进而在显示器上生成热图像和温度值,并可以对温度值进行计算的一种检测设备。  从物理原理来解释,就是人体是一个能够自然产生的红外辐射源,不停向周围发散和吸收红外辐射。正常的人体各部位的温度是具有稳定性和特殊性的,不同温度有不同的热场,当某个部位出现病变或异常时,此处的血流量会发生变化,导致局部温度的改变。红外热成像就是根据这一

2017-02-23 14:46:16 6246

转载 网络上长说的监听某个端口是什么意思

首先了解一下TCP/IP协议中的端口指的是什么呢?如果把IP地址比作一间房子 ,端口就是出入这间房子的门。真正的房子只有几个门,但是一个IP地址的端口 可以有65536(即:256×256)个之多!端口是通过端口号来标记的,端口号只有整数,范围是从0 到65535(256×256-1)。 在Internet上,各主机间通过TCP/IP协议发送和接收数据包,各个数据包根据其目的主机的ip地址来进

2017-02-21 19:18:44 11820 1

原创 dropout的理解

在训练的时候,我们只需要按一定的概率(retaining probability)p 来对weight layer 的参数进行随机采样,将这个子网络作为此次更新的目标网络。可以想象,如果整个网络有n个参数,那么我们可用的子网络个数为 2^n 。 并且,当n很大时,每次迭代更新 使用的子网络基本上不会重复,从而避免了某一个网络被过分的拟合到训练集上2^n:参数节点可以分为1或0;所有n个不同的节

2017-02-17 10:47:03 324

原创 netsdk、playsdk

netsdk: 公司开发的接口,供内部或其它公司接入我们公司服务器或设备等。。。playsdk:公司设备的视频是私有编码形式的。用此sdk来播放解码。F7300:可有协议,供客户定制平台开发F7200:提供公司NETSDK, 供客户定制平台开发

2017-02-17 09:46:10 2317

原创 曙光服务器、带宽

带宽( bandwidth):在模拟信号系统又叫频宽,是指在固定的时间可传输的资料数量,亦即在传输管道中可以传递数据的能力。通常以每秒传送周期或赫兹(Hz)来表示。比特率也就成了一个带宽事实的标准叫法了。比特率:是指每秒传送的比特(bit)数。单位为bps(Bit Per Second),比特率越高,传送数据速度越快。声音中的比特率是指将模拟声音信号转换成数字声音信号后,单

2017-02-14 14:53:21 619

转载 图像分类中的max pooling和average pooling是对特征的什么来操作的,结果是什么?

          接触到pooling主要是在用于图像处理的卷积神经网络中,但随着深层神经网络的发展,pooling相关技术在其他领域,其他结构的神经网络中也越来越受关注。<img src="https://pic4.zhimg.com/58b4644ffe54e733fb133466a40a8a2f_b.jpg" data-rawwidth="458" data-rawhei

2017-02-07 10:22:48 3342

转载 浅谈协方差矩阵

一、统计学的基本概念统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],

2016-12-14 11:52:41 352

转载 (EM算法)The EM Algorithm

EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式      回顾优化理论中的一些概念。设f是定义域为实数的函数,如果对于所有的实数x,,那么f是凸函数。当x是向量时,如果

2016-12-12 16:30:10 614

原创 准确率与召回率(Precision & Recall)、F-score

1、两个最常见的衡量指标是“准确率(precision)”(你给出的结果有多少是正确的)和“召回率(recall)”(正确的结果有多少被你给出了)这两个通常是此消彼长的(trade off),很难兼得。很多时候用参数来控制,通过修改参数则能得出一个准确率和召回率的曲线(ROC),这条曲线与x和y轴围成的面积就是AUC(ROC Area)。AUC可以综合衡量一个预测模型的好坏,这一个指标综合了

2016-12-06 10:59:29 13992 2

原创 cifar10尝试直接用图片训练

一、作用:直接用图片训练可以节约硬盘空间二、步骤:1、将二进制中的图片数据和对应的lable值读出来,保存成jpg文件,见另外一篇博客2、将jpg文件放到对应的data目录下,将对应的jpg文件的地址和lable标记写到对应的txt文件下:例如     /home/z_mx/caffle-20161103/caffe-master/data/cifar10/batch1/data_

2016-12-05 11:42:17 1316

原创 二进制图片保存为jpg文件

在深度学习时,制作样本数据集时,需要产生和读取一些二进制图像的数据集,如MNIST,CIFAR-10等都提供了适合C语言的二进制版本。以CIFAR-10的数据集为例,官网上有两段关键的介绍:二进制版本数据集格式为(图像大小为32x32):1 x label>3072 x pixel>...1 x label>3072 x pixel>123In other words, t

2016-12-02 11:23:34 5388

转载 ofstream的使用方法--超级精细。C++文件写入、读出函数(转)

ofstream的使用方法ofstream是从内存到硬盘,ifstream是从硬盘到内存,其实所谓的流缓冲就是内存空间; 在C++中,有一个stream这个类,所有的I/O都以这个“流”类为基础的,包括我们要认识的文件I/O,stream这个类有两个重要的运算符: 1、插入器(  向流输出数据。比如说系统有一个默认的标准输出流(cout),一般情况下就是指的显示器,所以,c

2016-11-30 11:26:41 930

转载 RCNN、FastRCnn总结

RCNN的缺点:重复计算Fast-RCNN:RCNN的加速版本,在我看来,这不仅仅是一个加速版本,其优点还包括:(1) 首先,它提供了在caffe的框架下,如何定义自己的层/参数/结构的范例,这个范例的一个重要的应用是python layer的应用(2) training and testing end-to-end为了达到这一点其定义了ROIPooling层,因为有了这个,使

2016-11-23 14:23:22 856

原创 mnist、cifar10试跑总结

一、 mnist在caffe上的学习与训练1、参考薛开宇的学习笔记2、由于公司未联网,所以直接下载数据库放在: /data/mnist  下面3、运行./create_mnist.sh  生成对应的数据库      运行出错提示找不到文件,主要是路径不对,路径的表达方式:./example/mnist/create_mnist.sh4、提示缺少什么库,一般是未将该库所

2016-11-18 11:16:46 1062

转载 CAFFE: Fine-tuning for style recognition

假设现在有一个20类的分类问题,那么最简单的方法就是重新训练一个基于该20类的分类问题。但如果我们已经有一个1000类的模型呢?我们其实不必大费周张的重新训练一个20类的模型,其实两个模型只有最后一层不一样,即一个的输出为1000维,另一个为20维。那么我们完全可以将1000类模型除最后一层的其余层拿过来使用,然后再使用现有数据对原模型执行fine-tuning操作,这样可以大大提高训

2016-11-17 19:41:51 364

转载 RCNN & SPP-net & Fast-RCNN & Faster-RCNN

(2015-06-14 15:00:42)转载▼签:特征卷积微调图像分类器分类 先截个图,这就是RCNN的原理图。& SPP-net & Fast-RCNN & Faster-RCNN" title="RCNN & SPP-net & Fast-RCNN & Faster-RCNN" width="491" hei

2016-11-16 17:39:08 311 1

转载 Caffe fine-tuning 微调网络

转载请注明出处,楼燚(yì)航的blog,http://www.cnblogs.com/louyihang-loves-baiyan/目前呢,caffe,theano,torch是当下比较流行的Deep Learning的深度学习框架,楼主最近也在做一些与此相关的事情。在这里,我主要介绍一下如何在Caffe上微调网络,适应我们自己特定的新任务。一般来说我们自己需要做的方向,比如在一些特定的

2016-11-16 17:34:48 270

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除