2018年07月_CHNguoshiwushuang

原创阅读论文《Deep Photo Enhancer: Unpaired Learning for Image Enhancement from Photographs with GANs》

这篇论文主要用来非对齐图像的增强，这里只简要介绍一下文章的idea。这篇文章主要有三个创新点，分别如下： 1、对U-net进行修改，增加提取全局特征进行学习。 2、对WGAN进行改进，可以自动调整其权重系数。 3、在生成器中添加可以学习特定风格的individual BN层。下面进行详细介绍。这篇文章主要还是对unpair的图像进行增强，属于弱监督学习的范畴。所以采用的基...

2018-07-30 00:34:22 2497

原创使用tensorflow实现卷积的几种操作

这里简要总结一下tensorflow实现卷积操作的几种写法，定义方式有很多。例如使用一个9x9的卷积核将一个三通道图像转换成64通道的feature,遇到过的有以下一些：直接定义就写这种写法简单粗暴，一边定义卷积核、偏置和卷及操作一边写，优点是操作灵活，但是代码量太大尤其是重复单元较多的时候，一个例子如下:weight = tf.get_variable('weig...

2018-07-29 22:12:54 2954 1

原创一些图像基本算法的了解1（SIFT,HOG)

研究生的方向是计算机视觉和图像处理，虽然现在基本都是依赖深度学习的方法，但是传统的一些图像算法里的一些概念还是要简要了解一些，深入理解可以查看链接参考大佬们写的教程。SIFT SIFT的全称是Scale Invariant Feature Transform，即尺度不变特征变换。SIFT可以提取位置、尺度、旋转不变量，具有极好的稳定性，具体关于SIFT的了解可以参考这些：1....

2018-07-28 23:35:22 907

原创 cycleGAN

传统GAN的原理已经了解，写博客还是为了学习新东西，cycleGAN网上已经有了很多介绍，这里也是参考别人写的东西，自己再学习了解。 cycleGAN个人感觉主要可以用于风格迁移，可以用来处理图像转换过程中数据unpair的问题。其本质是两个对称的GAN,构成一个环形网络。两个GAN共享两个生成器，并各自带一个判别器，即总共两个判别器和两个生成器。其基于的原理是，一个A类型的图片，经...

2018-07-27 22:12:18 5661 2

原创亚像素

最近接触到一些和subpixel相关的操作，对亚像素相关基本概念还不是很了解，所以这里想了解一下。在相机成像的过程中，获得的图像数据是将图像进行了离散化的处理，由于感光元件本身的能力限制，到成像面上每个像素只代表附近的颜色。例如两个感官原件上的像素之间有4.5um的间距，宏观上它们是连在一起的，微观上它们之间还有无数微小的东西存在，这些存在于两个实际物理像素之间的像素，就被称为“亚...

2018-07-22 15:52:06 13708 3

原创从图像转换到txt和从txt读取图片，并使用tensorflow实现epoch无重复迭代

闲话少说，从图像转换成txt非常简单，直接附代码，如下所示：import osimport randomdef generate(dir): files = os.listdir(dir) print('****************') print('input :',dir) print('start...') listText =...

2018-07-21 23:22:59 1145

原创 Instance norm

本来这周已经写好了轻量级网络的总结（mobilenet和shufflenet)，可是没有来得及保存然后电脑就关机了，写博客也是为了学习东西，所以也不打算重新再写了。还是简要写一下最近用到的instance norm。在目前的GAN和style transfer的任务中，目前的IN norm要好于BN，IN主要用于对单张图像的数据做处理，而BN主要是对Bacth的数据做处理。由于BN...

2018-07-20 21:18:37 6349 1

原创 WGAN-GP

最近做项目用到了GP-WGAN，所以感觉有必要了解一下，这里简要参考别人的博客自己做一个总结吧。 GAN通过训练判别器和生成器来使得生成器生成的数据分布上尽可能和真实样本的分布完全一致。但是在GAN训练的过程中常常会存在训练不稳定的现象。因此蒙特利尔大学的研究者对WGAN进行改进，提出了一种替代WGAN判别器中权重剪枝的方法，即具有梯度惩罚的WGAN，从而避免训练不稳定的情况。 ...

2018-07-08 23:16:03 3416 2

原创阅读论文《LOW-LIGHT IMAGE ENHANCEMENT USING CNN AND BRIGHT CHANNEL PRIOR》

这是2017年ICIP的一篇论文，使用一个联合架构对图像进行增强。首先，是一个去噪网络；然后使用可以自动根据通道亮度优先设置转换函数的增强网络；此外，还设定了一个额外的估测周围环境亮度的过滤器。过去的方法包括基于retinex理论的方法，这个方法假定去除光照影响可以增强低照图像，但是这种方法是对RGB图像进行处理的，容易造成颜色失真；基于直方图均衡化的处理，主要用来增加图像的对比度，但...

2018-07-01 23:02:23 3743 3

原创 tf.depth_to_space和torch.nn.pixel_shuffle

最近做项目用到了这两个函数，本人经过仔细对比，认为它们的功能应该是完全一样的，都是将一个较多通道的特征变成较少通道的特征，具体定义如下：def depth_to_space(input, block_size, name=None): block_size用来说明数据移动的方式。该函数的操作是将block_size x block_size数目的特征图转换成一个不重叠的特征，...

2018-07-01 22:49:51 11916 3

CHNguoshiwushuang的博客