1.WPGAN使用layer normalization
2.CUDA&cuDNN
CUDA:Compute Unified Device Architecture,是一种通用的并行计算架构,该架构使GPU能够解决复杂的计算问题,它包含了CUDA指令集及GPU内部的并行计算引擎。
cuDNN:CUDA Deep Neural Network library,它是专门针对深度学习框架设计的一套GPU计算加速方案,提供了对深度神经网络向前向后的卷积池化以及RNN的性能优化
3.Tensorflow
tensorflow 采用张量的数据结构来表示它内部的所有数据,也只有张量形式的数据才可以在不同计算设备和计算操作之间传递。每个张量都有自己的静态类型,以及张量的形状(各个唯度的长度)。
4.GAN的应用扩展
比如翻译,input A, output B .
- 注意网络的优化学习范式为无监督学习
5.关于GAN的一点感悟
可以用来任何事情,如检测,分类,分割,图像增强,超分。
(😏,我真的选了一个好方向)
几个不成熟的想法
- 计算视觉其实就是对一个图片对的统计分布结果的分析;
- 而至于图像的频域和空域只是对图像客观信息对描述
- 卷积是一种积分运算,它可以用来描述
线性时不变系统
的输入和输出的关系。
2论文idea
GAN-cls具有感知的判别器
-
GAN-cls增强判别器的功能,领其不仅能判断图片真伪,还能判断匹配的真伪
-
是否可以用LSGAN替换掉WGAN-UP
LSGAN使用更加平滑和非饱和提督的损失函数—最小乘二来代替原来的Sigmoid交叉熵,L2正则,在数据偏离目标时会有一个与其偏离距离成比例的惩罚,将其拉回来,从而使数据的偏离不会越来越远。