一条咸咸咸咸咸鱼-CSDN博客

转载 Perceptual Losses for Real-Time Style Transfer and Super-Resolution翻译

原文链接：https://www.jianshu.com/p/b728752a70e9。《基于感知损失函数的实时风格转换和超分辨率重建》Abstract摘要：我们考虑的图像转换的问题，即将一个输入图像变换成一个输出图像。最近热门的图像转换的方法通常是训练前馈卷积神经网络，将输出图像与原本图像的逐像素差距作为损失函数。并行的工作表明，高质量的图像可以通过用预训练好的网络提取高级特征、定义并优...

2018-08-31 00:37:27 595

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution阅读（一）

一、文章出处Perceptual Losses for Real-Time Style Transfer and Super-Resolution，arxiv地址：https://arxiv.org/abs/1603.08155。二、文章内容因为在实训中只需要做风格转换的部分，并且这篇文章的最大贡献之一也是实现了实时的风格转换。上一篇阅读的文章，虽然效果好，但对于每一张要生成...

2018-08-31 00:37:12 524

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution阅读（二）

三、损失函数虽然文章说的是perceptual losss，但是感觉上跟上一篇文章的约束并没有什么区别，我们可以来看看。Feature Reconstruction Lossj表示网络的第j层。 CjHjWj表示第j层的feature_map的sizeStyle Reconstruction Loss对于风格重建的损失函数，首先要先计算Gram矩阵，产生的featu...

2018-08-31 00:37:02 380

原创 Perceptual Losses for Real-Time Style Transfer and Super-Resolution代码详解

按照文中所述的残差网络架构如下，只有结尾和开头的卷积核大小为9*9，其余均为3*3的卷积核，中间有5个残差块组成的bottleneck，最后利用tanh函数将图片的RGB值映射到0~255（原来是-1~1之间的）。 conv1 = _conv_layer(image, 32, 9, 1) conv2 = _conv_layer(conv1, 64, 3, 2) conv...

2018-08-31 00:36:54 947 1

原创 Batch Normalization 与 Instance Normalization

归一化的原因：归一化是为了加快训练网络的收敛性，可以不进行归一化处理归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在-1--+1之间是统计的坐标分布。归一化有同一、统一和合一的意思。无论是为了建模还是为了计算，首先基本度量单位要统一，神经网络是以样本在事件中的统计分别几率来进行训练（概率计算）和预测的，归一化是同一在0-1之间的统计概率分布；当所...

2018-08-31 00:36:46 3555

原创自编码内容学习

自编码网络抽象结构：欠完备自编码：编码维度小于输入维度的自编码器称为欠完备(undercomplete)自编码器。可以强制自编码器捕捉训练数据中最显著的特征。学习过程可以简单的描述为最小化一个损失函数：L(x,g(f(x)))正则自编码器隐藏编码的维数允许与输入相等或者大于输入稀疏自编码器去躁自编码变分自编码 ...

2018-08-30 10:37:37 311

原创卷积与反卷积详解

下面是暑期报告PPT的一个截图展示，是对于卷积与反卷积的具体理解，标题如下：首先先从一维的离散形式出发，可以类比于信号处理中的德尔塔函数。这里说明的是信号系统的线性不变形，即经过作用函数以后，线性不变，位移不变。把线性不变性质与位移不变性质（又可以理解成时间不变性，在信号处理过程中），结合起来可以得到下式：推广到二维空间中（卷积与反卷积均在二维空间中存在）在...

2018-08-30 10:04:11 3008

关于深度学习在目标跟踪领域的学习心得目标跟踪算法可以被分为产生式（generative model）和判别式（discriminative model）两大类别，产生式方法运用生成模型描述目标的表观特征，之后通过搜索候选目标来最小化重构误差；判别式方法通过训练分类器来区分目标和背景。在现实情况中，由于目标跟踪只提供第一帧的bounding box，且具有不确定性，在遮挡、旋转、光照变换等情况下...

2018-08-30 02:02:05 3584

原创 linux(CentOS)下的常用操作

1、文件复制命令cp命令格式：cp [-adfilprsu] 源文件(source) 目标文件(destination)cp [option] source1 source2 source3 ... directory参数说明：-a:是指archive的意思，也说是指复制所有的目录-d:若源文件为连接文件(link file)，则复制连接文件属性而非文件本身-f:强制(force...

2018-08-30 01:55:29 259

原创分割网络

首先需要弄清楚以下几个概念：语义分割(semantic segmentation) 目标检测(object detection) 目标识别(object recognition) 实例分割(instance segmentation)语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类目标检测,就是在一张图片中找到并用box标注出所有的目标.目标识别,就是检测和用...

2018-08-30 01:46:47 3456

翻译 torch的常用损失函数

torch的常用损失函数nn.L1Loss loss(xi,yi)=|xi−yi|x,y需要有一样的维度。nn.MSELoss均方损失函数loss(xi,yi)=(xi−yi)2loss(xi,yi)=(xi−yi)2nn.BCELoss二分类用的交叉熵，用的时候需要在该层前面加上 Sigmoid 函数。交叉熵的定义参考 wikipedia 页面。因为离散...

2018-08-30 01:05:08 2995

原创 torch的常用模块学习

一、nn模块nn.Identity()这个函数建立一个输入模块，什么都不做，通常用在神经网络的输入层。用法如下：mlp = nn.Identity()print(mlp:forward(torch.ones(5, 2)))这个可以用在残差学习中。如果输入需要有多个保存，也可以使用多个nn.Identity()mlp = nn.Identity()nlp = nn.I...

2018-08-30 00:53:53 15474 2

原创 A Neural Algorithm of Artistic Style 阅读（三）

五、实验结果分析上图是对于同一张街景图下，多个风格的转换。可以看到这篇文章的一个致命缺点，就是速度很慢。因为是对输入图像就进行调整，所以没生成一张图像就要重新进行训练，虽然现在可以多个GPU训练，但是也不可能在几秒中之内得到结果。所以之后会不断地出现文章在速度方面的追求。很直观的理解就是训练好网络以后，通过前馈神经网络直接生成图片。上图是在不同参数情况下的结果。从左到右，α/β...

2018-08-30 00:33:08 649

原创 A Neural Algorithm of Artistic Style 阅读（二）

接上文A Neural Algorithm of Artistic Style 阅读（一）的损失函数详解。对于content loss来说，因为VGG结构能够提取图片的高层图片，在generated image 和 content image之间通过已经训练好的VGG网络取CONV4_2层的feature map输出，利用最小平方差来计算二者的距离，虽然公式里面有一个1/2，是为了之后...

2018-08-30 00:22:17 392

原创 A Neural Algorithm of Artistic Style 阅读（一）

一、文章二三 A Neural Algorithm of Artistic Style，论文地址：https://arxiv.org/pdf/1508.06576v2.pdf，发表于CVPR2016。在一开始阅读的时候，觉得想法真的很好，一般都是开山难啊，不然也不会有后续一系列这方面的研究，以及与GAN相关的风格转换工作了。虽然arxiv上的版本扯了半天的可以此项工作可以提供人类是...

2018-08-30 00:02:28 695

原创对sytle-transfer的应用价值的思考

对于实用价值来说，除了style translation直观的转换意义外，还有以下几点可以考虑：1、将图像上的应用迁移到视频上CycleGAN [7]中已有良好的结果显示，但目前尚未实现。2、实现跨域学习CoGAN [8]，StarGAN [9]可以实现在属性上的多个域同时转换，可以应用到互动娱乐应用中去。[10]中考虑到重新标注新的数据集（目标域）代价是非常大的，但已有标签数...

2018-08-29 22:47:31 233

原创对于style-transfer客观评价标准的思考

对于客观评价标准，目前我主要了解可以从以下几方面入手。1、转换质量转换质量又可以用转换程度与转换的多样性来衡量。对于转换程度评价，可以通过预训练ResNet [1]，GoogleNet等具有较高分类能力的深层网络模型，根据目标域标签对转换结果进行分类，分类准确率越高也就说明了从源域到目标域的转换越成功。因为style translation本身是一个域与域之间的转换，所以使用分类器对转...

2018-08-29 22:46:06 828

原创 linux环境下gedit文本编辑器的安装以及使用

由于服务器是基于CentOS的，所以所有的下载命令应使用 yum -y,而不是apt-get使用管理员身份下载gedit，使用命令：sudo yum -y install gedit安装完成：安装完成后就可以使用gedit 打开文档进行编辑里，之后有可能使用到的命令如下：CTRL-Z:撤销　　CTRL-C:复制　　CTRL-V:粘贴　　CTRL-T:缩进　　...

2018-08-28 13:46:00 21326 2

原创如何安装luajit

可以参考官方文档：http://luajit.org/install.html。首先进入/tmp的目录，然后从官网的网址上面根据路径下载安装包。wget http://luajit.org/download/LuaJIT-2.0.4.tar.gz然后解压缩文件如下：tar zxvf LuaJIT-2.0.4.tar.gz解压完成后，进入相应的文件夹：cd LuaJI...

2018-08-26 09:07:30 8241

原创 Torch关键模块的安装以及简单介绍

1、nn模块首先对nn模块进行下载，使用luarocks下载十分方便2、nngraph模块3、image模块

2018-08-25 19:01:15 2398

原创 Ubuntu 14.04 LTS环境下安装torch 7以及相关

按照官方给定的教程开始安装，可以安装在Ubuntu 14 。教程网址：http://torch.ch/docs/getting-started.html#installing-torch。首先确定系统是否安装Python以及python的版本。在命令行中输入python命令，可得当前python版本为2.7 ，不用再安装。创建torch想要防止位置的文件夹 mkdir torch....

2018-08-25 18:54:49 313

原创 OpenCV实现漫水填充（待完善）

OpenCV实现漫水填充（待完善）定理：用一种特定的颜色填充连通区域，通过设置可联通像素的上下限以及连通方式来达到不同的填充效果的方法。自动选中和种子相连的区域，接着将该区域替换成指定的颜色。也可以用来从输入图像获取掩码区域，掩码区域会加速区域，或只处理掩码指定的像素点。函数调用： int floodFill(InputOutputArray

2017-08-06 20:37:47 568

原创 OpenCV实现膨胀与腐蚀

OpenCV实现膨胀与腐蚀形态学（morphlogy）就是基于形状的一系列图像处理操作，而膨胀与腐蚀是两种最基础的形态学操作。开运算、闭运算、形态学梯度、顶帽、黑帽都是基于膨胀与腐蚀来实现的。膨胀与腐蚀主要可以用来 1.消除噪音 2.分割出独立的图像元素，在图像中连接相邻的元素

2017-08-04 15:53:02 868

原创双边滤波器

双边滤波器的实现双边滤波器的目的就是保边去噪。主要是在高斯滤波的基础上增加对于像素差的考虑，如果像素差过大则利用高斯函数降低影响，只有相近的像素差才会具有较大的权重，对于中心像素的值有较大影响。具体实现函数如下:其中，权重因子由两部分组成，一部分是定义域（中心像素与领域像素的距离差）：另一部分是值域（中心像素与领域像素的像素差：）综合起

2017-07-16 09:44:47 575

原创残缺棋盘问题

棋盘残缺问题分析

2017-02-21 10:51:03 3276

摸爬滚打的进阶之路