EnhanceNet的简要笔记

论文名称: EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis
归类: ICCV2017, 作者: Sajjadi, Mehdi~S.~M. 等

一、难点(看论文时遇到的问题):
  • E/P/T/A 是怎样进行结合的? 相加还是如何?
    (E: MSE, P: Perceptual similarity, T: Texture matching, A: Adversarial Training
  • T/A的具体执行过程?
二、问题:
  • 传统的方法基于pixel-wise reconstruction measures, 如PSNR, 该衡量方法生成的图像与我们视觉感知不符。
    (即,即便在衡量标准下得到的“分数”很高,认为生成的图像很好,但我们看上去却有over-smoothed的感觉,丢失了一定的high-frequency信息)
    这里写图片描述
三、改进方案:
  1. 在损失函数上做文章,以 creating realistic texture。(如题目所言,Through Automated Texture Synthesis
  2. 在performance evaluation上,用Object recongnition performance来替代传统的PSNR, SSIM等标准。
四、具体方法:
4.1 Network Arthitecture

这里写图片描述

作者对该网络结构的几个地方做了特别说明:

(1). 网络的主体部分使用了residual blocks。原因是,相比于stacked convolution layers, 其收敛速度更快。

Reference: 残差的提出【2】, 残差首次用于SR【3】

(2). 作者探讨了为什么会选择nearest neighbor upsampling.

A. Bicubic interpolation introduces redundancies to the input image and leads to higher computational cost.

B. Convolution transpose layers (which unsample the feature activations inside the network) would produce checkerboard artifacts in the output. (棋盘格效应), 需要通过额外的regularization term来修正。增加了计算量。

C. 可以用NN upsampling + Conv 来替代Transposed convolutional layers. 在某些特定的模型下依然会产生棋盘格效应,但在大多数complex models里面都不需要额外添加正则化项。

Reference:Bicubic interpolation的使用【4】,Convolution transpose layers的使用【5】 Nearest neighbor upsampling【6】

(3). 输入的是低分辨率的图,输出的是残差图像。作用: It does not need to learn the identity functioin forILR.




4.2 Training and loss functions: (重点部分)
Pixel-wise loss in the image-space    传统的基于MSE的方法

Perceptual loss in feature space    把最后生成的图像映射到某一特征空间,再做MSE

Texture matching loss             映射到某一特徵空间还不够,再进行精细的纹理匹配,

Adversarial training         在特定的Descriminative model下,使得生成的图像无法被识别为是生成的

(1):传统的基于MSE的loss function:

LE=||IestIHR||22(1)

(2):Perceptual similarity measure:*

Both Iest and IHR are first mapped into a feature space by a differentiable function ϕ before computing their distance.

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值