深度学习
文章平均质量分 54
hjimce
追求实现文献算法的快感,追求学会一个新算法的充实感
展开
-
深度学习(四十)caffe使用点滴记录
好在caffe为我们提供了一个可以用python编写新的网络层的方法,直接用python语言编写新的网络层,然后在caffe的网络配置文件,稍作修改,就可以轻松容易创建新的网络层。其具体环境配置搭建过程如下:1、编译caffe的时候,不能直接使用make pycaffe,而是应该使用:原创 2016-07-11 21:16:28 · 8095 阅读 · 1 评论 -
深度学习(三十九)LSTM、GRU网络入门学习-未完待续
众所周知,RNN是深度学习领域用于解决序列问题的神器,从理论的上来说,RNN是可以实现长时间记忆的。然而RNN反向求导会出现梯度弥散,导致我们很难训练网络,对于长时刻记忆总不尽人意,于是就诞生了LSTM。下面用个形象点的例子,解释长短记忆,让我们来看两个英语完形填空题目:(1)"Jane walked into the room. John walked in too. Jane said hi to ___"。(2)"Jane walked into the room. John walked in原创 2016-04-24 17:10:26 · 13862 阅读 · 1 评论 -
深度学习(四十二)word2vec词向量学习笔记
一、使用原版word2vec工具训练1、到官网到下载,然后选择export 到github2、编译:make3、下载测试数据http://mattmahoney.net/dc/text8.zip,并解压4、输入命令train起来:time ./word2vec -train text8 -output vectors.bin -cbow 1 -size 200 -window 8 -negative 25 -hs 0 -sample 1e-4 -threads 20 -binary 1 -iter原创 2016-06-02 10:57:56 · 11030 阅读 · 0 评论 -
深度学习(四十一)cuda8.0+ubuntu16.04+theano、caffe、tensorflow环境搭建
1、一开始安装的时候,老是无法屏蔽另外一个驱动,最后就先用ubuntu的系统设置,附加驱动,先把nvidia的驱动给装上去,重启后,然后却无法进入alt+ctrl+f1终端确是黑屏的。只能通过alt+ctrl+f7 重新进入图形界面,重新切换回nouveau驱动。这个时候重启发现,竟然无法进入图形界面,因此应该是成功屏蔽了这没用的驱动1、安装cuda的过程中,一直跳出错误:If you'r原创 2016-07-22 21:36:58 · 36919 阅读 · 4 评论 -
深度学习(四)卷积神经网络入门学习(1)
卷积神经网络与我们之前所学到的图像的卷积的区别,我的理解是:我们之前学图像处理遇到卷积,一般来说,这个卷积核是已知的,比如各种边缘检测算子、高斯模糊等这些,都是已经知道卷积核,然后再与图像进行卷积运算。然而深度学习中的卷积神经网络卷积核是未知的,我们训练一个神经网络,就是要训练得出这些卷积核,而这些卷积核就相当于我们学单层感知器的时候的那些参数W,因此你可以把这些待学习的卷积核看成是神经网络的训练参数W。原创 2015-08-06 21:40:54 · 78060 阅读 · 44 评论 -
深度学习(四十三)条件变分自编码器概述
目前深度学习主要以有监督学习为主,有监督需要大量的标注样本数据,我们做项目的时候,一般没有那么多数据。深度生成模型目前比较经典的有:对抗网络、变分自编码器、DBN(deep belief networks),主要应用于半监督、无监督学习,比如《Variational Autoencoder for Deep Learning of Images, Labels and Captions》、《Semi-supervised Learning with Deep Generative Models》。可能大家觉原创 2017-01-05 18:54:31 · 11300 阅读 · 1 评论 -
深度学习(四十五)条件对抗网络
本文主要简单讲解文献:《Conditional Generative Adversarial Nets》,算法比较简单,只要懂对抗网络,基本上几分钟就可以看懂条件对抗网络的实现。一、算法概述在无条件对抗网络中,生成采样的样本是随机的,我们无法控制具体生成什么样的图片。加入条件模型,主要是直接在生成网络、判别网络中输入层中,分别加入额外的标签信息条件y,当然也可以是其它任意的条件信息。比如我们需要指定生成网络G用于生成一张具有微笑表情的人脸图片;同样的,D网络需要判别一张输入的图片,是否是一张具有微笑的伪原创 2017-01-13 13:58:47 · 5414 阅读 · 0 评论 -
深度学习(四十六)Adversarial Autoencoders学习笔记
如上图所示,x、z分别表示输入样本输入、编码向量z。p(z)是我们希望加入的潜变量先验分布,q(z|x)是编码分布函数,p(x|z)是解码分布函数,pd(x)表示真实的数据分布,p(x)表示模型数据分布。自编码网络编码函数q(z|x)。对抗自编码网络的每个mini-batch训练可以分成两个过程:原创 2017-01-13 18:58:45 · 12615 阅读 · 4 评论 -
深度学习(十七)基于改进Coarse-to-fine CNN网络的人脸特征点定位
本篇博文主要讲解2013年face++的大牛们提出的改进的DCNN模型《Extensive Facial Landmark Localization with Coarse-to-fine Convolutional Network Cascade》,发表于2013年ICCV上的一篇用于定位多个人脸特征点的文献,实现了68个人脸特征点的高精度定位。这篇paper没有给出训练数据,也没有给出测试模型、源代码等,所以源代码需要自己写,训练数据我们需要自己到IBUG网站下载,可以下载到两千多张的训练数据,这篇p原创 2015-11-29 20:39:33 · 27944 阅读 · 48 评论