2017年09月_imperfect00

12月 11月 10月 09月 08月 07月 06月 04月 03月 02月 01月

原创 ImportError: /usr/local/lib/python2.7/dist-packages/torch/lib/libgomp.so.1: version `GOMP_4.0' not f

import torchimport cv2出现错误:ImportError: /usr/local/lib/python2.7/dist-packages/torch/lib/libgomp.so.1: version `GOMP_4.0' not found (required by /usr/lib/x86_64-linux-gnu/libsoxr.so.0)解决方法是将

2017-09-25 18:57:12 4368

原创 Enhanced Deep Residual Networks for Single Image Super-Resolution

网络结构为,conv(3,3)+residual block(N个residual block层),+conv(3,3)+upsample block.residual block:def resBlock(x,channels=64,kernel_size=[3,3],scale=1): tmp = slim.conv2d(x,channels,kernel_size,activation_

2017-09-23 23:08:20 820

原创 DCGAN代码分析

生成网络生成网络输入为噪声向量z,和输出类别向量y,输出为生成图像.以手写字体图像为例,z为100维的向量,由于手写字体分为10类,因此输出类别向量y为10维的向量,对应的类别的索引值为1,其他值为0.代码如下:def generator(self, z, y=None): with tf.variable_scope("generator") as scope: if not self

2017-09-23 22:52:53 2381

原创 Style Transfer for Anime Sketches with Enhanced Residual U-net and Auxiliary Classifier GAN

网络结构本文的GAN网络结构为:生成网络的输入为需要风格转换的图像即input,以及风格特征.采用VGG16/19的fc1层,提取风格图像的特征,风格特征为4096维的向量.生成网络结构和目标函数文章试验发现,如果u-net可以使用底层的网络学习到特征,那么高层的网络就不会去学习,如图4所示,u-net网络的输入输出都为同一张图像,也就是实现复制图像的功能.由于输入输出是相同的,损失函数会立刻变为0

2017-09-23 22:49:52 2716

原创 EOFError

使用cpickle.load(open(filename,’rb’))时出现错误:EOFError这是因为读取的文件为空文件,例如我要读取模型文件:checkpoint_1 = pickle.load(open(options['checkpoint_output_directory'] + options['checkpoint_stage1'],

2017-09-20 18:11:48 19051

原创 ubuntu16.04安装lasagne

下载lasagnegit clone https://github.com/Lasagne/Lasagne.git # 会建立一个Lasagne目录安装依赖库:cd Lasagnepip install -r requirements.txt安装lasagne:sudo python setup.py install 测试cd examplesudo python mnist.py

2017-09-20 18:10:20 1847 1

原创 taberror inconsistent use of tabs and spaces in indentation pycharm

pycharm编写python代码时,有时从不同的文件复制代码,粘贴后会出错,taberror inconsistent use of tabs and spaces in indentation pycharm解决方法是,选择菜单栏:Edit -> Convert Indents -> To Spaces

2017-09-20 18:09:11 3285 1

原创 ValueError: compiledir '/home/external/.theano/compiledir_Linux-4.4--generic-x86_64-with-Ubuntu-16.0

unbuntu安装theano后,import theano出现出错:ValueError: compiledir '/home/external/.theano/compiledir_Linux-4.4--generic-x86_64-with-Ubuntu-16.04-xenial-x86_64-2.7.12-64' exists but you don't have read,

2017-09-19 15:18:32 957

原创 tensorflow 多gpu训练

当使用多个gpu训练时,输入数据为batch_size*num_gpu,这样模型训练时间可以大大较小.tensorflow中使用制定gpu可以通过tf.device()实现.例如我想使用0号显卡:gpu_ind=0with tf.device("/gpu:{}".format(gpu_ind))下面介绍一下多gpu模型训练.代码参考自OpenSeq2Seq:https://github.com/N

2017-09-17 16:28:01 7966

原创 Video Frame Interpolation via Adaptive Separable Convolution

输入相邻的2帧图像I1,I2I_1,I_2,到一个encoder-decoder网络,encoder-decoder网络输出到4个子网络,4个子网络分别输出得到卷积核k1,h,k1,v,k2,h,k2,vk_{1,h}, k_{1,v}, k_{2,h}, k_{2,v}.用预测的卷积核k1,h,k1,v,k_{1,h}, k_{1,v},与输入帧I1I_1进行卷积操作,卷积核k2,h,k2,v,k

2017-09-17 11:55:18 1659

原创人脸旋转-Towards Automatic Image Editing: Learning to See another You

文献主要应用:1.人脸旋转2.图像修复3.光照增强原理分析模型结构为: 生成图像分为两个过程:第一个过程为Image generation,生成得到旋转图像.通过一个attribute向量,表示pose特征,将atrribute输入两个全连接层,具体网络结构为 FC(512)-FC(900×na)-Reshape(30,30,na),得到30×30×na30\times30\times n_a的f

2017-09-17 11:35:30 535

原创 face-expression-detect

github代码:https://github.com/adithyaselv/face-expression-detect原理人脸表情分类,将人脸表情分为7类,emotions={ 1:"Anger", 2:"Contempt", 3:"Disgust", 4:"Fear", 5:"Happy", 6:"Sadness", 7:"Surprise"}分类原理为,首先采用dlib检测人脸的68个特征

2017-09-14 20:10:08 1296

原创脸型分类-Face shape classification using Inception v3

函数解析github 代码:https://github.com/adonistio/inception-face-shape-classifierCLASSIFY_FACE.py用于运行训练好的Inception model,对输入图像进行分类.CLASSIFY_FACE_CONFUSION.py与CLASSIFY_FACE.PY类似,但是讲述如结果和一个困惑度矩阵保存在文本文件中.EXTRACT

2017-09-14 20:08:57 2587

原创 ubuntu16.04安装mxnet

首先下载mxnet安装包:git clone --recursive https://github.com/dmlc/mxnet进入mxnet目录,并将mxnet/make/config.mk复制到mxnet/下:cd mxnetcp make/config.mk .修改config.mk文件的行为:USE_CUDA = 1USE_CUDA_PATH = USE_CUDA_PATH = /usr/

2017-09-14 18:12:23 1459

原创 SRU

SRU算法在文献Training RNNs as Fast as CNNs中提出.目的是针对RNN中当前step t的输出hth_t依赖于前一时刻ht−1h_{t-1}的输出,而导致无法进行并行计算,计算速度过慢.SRU通过有对LSTM循环单元进行简单化计算,使得计算过程可以并行,具体SRU计算公式如下:对于输入xtx_t,公式3,4,5可以并行计算.计算x˜t、ft和rt x^˜_t、f_t 和

2017-09-12 20:48:05 5520

原创 caffe 模型转tensorflow

下载模型转换代码:git clone https://github.com/ethereon/caffe-tensorflowcaffe-tensorflow模型转换文件为convert.py,可以将caffe的模型定义文件.prototxt和训练好的模型分别转换为tensorflow类,和tensorflow模型文件.在example文件夹下提供了examples/minist和examples/

2017-09-11 19:56:41 8429

原创 Squeeze-and-Excitation Networks

SENet的思想是对于不同通道的feature map,我们认为他的重要性是不同的,SENet通过添加一个Squeeze-and-Excitation(SE)模块,学习不同feature map的权重,例如我们输入feature map为C个通道,那么通过SE模块学习到一个长度为C的权重向量w,向量的第i个值,代表第i个通道的feature map的权重,将权重向量w与输入feature map相乘

2017-09-10 19:07:18 873

原创 Pose Guided Person Image Generation

生成网络网络包含两个生成网络,分别为G1,G2.生成网络G1输入为condition image和target pos的串联,生成粗略的姿势图像,即coarse result.生成网络G2,将condition image,与生成网络G1的输入串联,输入G2,生成一个difference map.将G1,G2生成图像相加得到最后的生成图像,即refined result.判别网络判别网络用于判别输入

2017-09-10 11:49:21 4179

原创空间变换网络--spatial transform network

CNN分类时，通常需要考虑输入样本的局部性、平移不变性、缩小不变性，旋转不变性等，以提高分类的准确度。这些不变性的本质就是图像处理的经典方法，即图像的裁剪、平移、缩放、旋转，而这些方法实际上就是对图像进行空间坐标变换，我们所熟悉的一种空间变换就是仿射变换，图像的仿射变换公式可以表示如下：式中，(xSource,ySourcex^{Source},y^{Source})表示原图像像素点，(xTar

2017-09-10 11:11:44 40659

原创 dual learning for machine translation

对于翻译系统，如语言A翻译到语言B，通常需要大量的语言对来训练神经机器翻译，而数据量的增大会大大的增加成本。本文通过构建两个神经翻译网络，θAB和θBA，这两个网络分别用于将语言A翻译到语言B和语言B翻译到语言A。文章先采用少量的语言对训练好这两个模型。之后，采用无监督学习，训练这两个模型，具体为将语言A输入网络θAB，同时将θAB的输出输入到网络θBA中，再采用强化学习的思想，对网络θAB和网络的

2017-09-10 10:43:18 553

原创 Recurrent visual attention

本文将深度学习与聚焦机制和强化学习结合起来，通过学习本篇文献，可以：理解聚焦机制中较简单的hard attention 了解增强学习的基本流程 (1)注意力机制(Attention)以物体识别为例，在进行分类的时候，不是一次对一张大图进行估计，而是分多次观察小部分图像，首先初始化一个图像坐标点l，以该坐标点为中心提取小部分图像，并通过一个Gilpse网络图区该部分的图像特征向量，将该部分的图

2017-09-10 10:37:28 449

原创 A neural algorithm of artistic style

文章的目的是对于给定的风格化模板，将其风格传输到输入图像中，风格传输采用的VGG的１-５个conv层，网络具体结构如下：图中，底端图片从左到右分别为风格图像（style image），风格转换结果图像(result image)，未风格转换的图像(content image),左边的网络的目的是使得style image 与result image 的风格特征尽量相似，这里用conv层的feat

2017-09-10 10:18:13 423

原创利用全局和局部GAN实现侧脸生成正脸

参考文献为:Beyond Face Rotation: Global and Local Perception GAN for Photorealistic and Identity Preserving Frontal View Synthesis文章对GAN网络进行改进,生成网络包含两个网络,一个用于局部特征生成,另一个用于全局特征生成,网络结构如下:如图所示,利用一个Local Pathwa

2017-09-10 10:09:52 7114

原创 tensorflow参数初始化--identity initializtion

卷积层权重初始化的时候,通常有以下几种方法:1.Random Uniform distribution函数为:class RandomUniform(Initializer): """Initializer that generates tensors with a uniform distribution. Args: minval: A python scalar or a sca

2017-09-08 11:54:11 1813

原创 python实现自动查找并使用空闲GPU

查看GPU memory,并将结果保存在tmp中:os.system('nvidia-smi -q -d Memory |grep -A4 GPU|grep Free >tmp')读取gpu memory:memory_gpu=[int(x.split()[2]) for x in open('tmp','r').readlines()]求剩余memory最多的显卡号,并设置CUDA_VISIBLE

2017-09-07 18:04:20 10027

原创 Fast Image Processing with Fully-Convolutional Networks

主要应用,1.滤波,如L0 平滑滤波;2.对比度增强3.风格转换4.雾天图像清晰化5.铅笔化(pencil drawing) 网络结构网络为9层空洞卷积(dilation convolution),每层卷积核大小为3×33\times3,stride=1. 1-7层dilation 值依次递增,分别为1,2,4,8,16,32,64,8,9层dilation rate为1.第s层的feature

2017-09-06 17:57:11 1769

原创 Regression by Conditional Adversarial Autoencoder

文章的思想是在对抗网络的基础上,引入年龄,性别等先验信息.网络结构图如下: 对于输入图像,即input face,将其输入4个卷积层,stride=2,加一个全连接层,FC_1,得到输出特征向量z,z的维度为50.将特征向量输入generator G网络,得到输出生成图像.网络中包含两个判别网络,discriminator z,用于判别输入维度50的向量z_prior,以及输入图像的encoder

2017-09-05 15:44:29 1562

原创 ValueError: Variable E_conv0/w/Adam/ does not exist, or was not created with tf.get_variable().

运行tf.train.AdamOptimizer()函数,例如下面代码: self.EG_optimizer = tf.train.AdamOptimizer( learning_rate=EG_learning_rate, beta1=beta1 ).minimize( loss=self.loss_EG

2017-09-05 11:55:45 9832

原创 matlab图像光照效果模拟

1.选取光源中心点(x0,y0) 加入输入图像宽,高分别为w,h,如果旋转光源在图像中心,则: x0=w/2 y0=h/2 2.求光照图像模拟光照方法为,离点光源越近的像素点的亮度值越大, f(x,y)=k∗(1−(x−x0)2+(y−y0)2√r)f(x,y)=k*(1-\frac{\sqrt{(x-x_0)^2+(y-y_0)^2}}{r})这里,k为常数,r为光源作用半径.clcc

2017-09-04 18:55:29 5478

原创 python 新建目录,删除目录,判断目录是否存在

python中可以使用os.mkdir()函数新建目录,例如在/home/下新建目录test,命令为:os.mkdir('/home/test')判断目录是否存在命令为:os.path.isdir('/home/test') :删除目录命令为:os.rmdir('/home/test') 得到目录下所有文件名数组:imagelist=os.listdir(file1+'/')

2017-09-04 18:23:25 3331

原创快速梯度下降法-SAGA

SGD对于目标函数:目标函数优化步骤:1.随机旋转索引j,即函数fj(x)f_j(x);2.更新参数x,采用sgd公式为:SAGA(STOCHASTIC VARIANCE REDUCTION METHODS)目标函数优化步骤:1.随机旋转索引j,即函数fj(x)f_j(x);2.对于上述目标函数,采用SAGA参数更新公式为:ϕk+1j=xk\phi_j^{k+1}=x^k.SAGA代码:https:

2017-09-01 12:23:46 5433