【风格迁移】Perceptual Losses for Real-Time Style Transfer and Super-Resolution

  • 本文的贡献在于将perceptual loss和feed-forward网络结合,处理速度很快。
  • 感知损失:用特征算损失,评估两张图片在内容和风格上的差异。
  • 减小特征图,扩大卷积核,可以在不增加计算量的情况下,扩大感受野。同时,这对需要连续变换的风格迁移也很重要
     

 

3.1 Image Transformation Networks

  1.   在上下采样中,使用步进和小步进卷积代替池化层。除残差模块外,均使用spatial batch normalization,输出层使用ReLU,将输出限制在[0, 255]。除第一和最后一层使用9 x 9卷积核外,其余均使用3 x 3卷积核。
  2. 输入和输出均为 3 x 256 x 256
  3. 使用5个残差模块,每个包含两个3 x 3的卷积层。
  4. 在几个Residual blocks之后,使用两个步进为2的卷积去对输入降采样,然后使用两个步进为1/2的卷积去上采样,虽然输入和输出的尺寸一样,但有两个好处:下采样后,我们可以在相同计算代价的情况下,用更大的卷积核,即获得更大的感受野。高质量的风格转换需要有尽可能连续的变换,因此需要在输入有更大的感受野。

 

3.2 Perceptual Loss Functions

使用两个perceptual loss functions,计算图片之间的内容和风格之间的差异。loss net是在ImageNet上做图片分类的VGG-16。

Feature Reconstruction Loss

计算两张图片之间的内容差异。作者使用layer relu2-2的输出作为图片内容,作者认为网络high-level的特征保存了内容和全部空间结构,但没有保存颜色、纹理和提取出的形状,因此要使用early layers。

具体计算:将经过Image Transform Net输出的图片和输入原图送入loss net,第j层卷积层输出的特征图相减后求二范数,平方后求平均输出。

 

Style Reconstruction Loss

作者使用layer relu1_2, relu2_2, relu3_3, and relu4_3的输出作为图片风格

首先计算经过Image Transform Net输出的图片和目标风格图片对应的Gram matrix(Cj x Cj):将图片送入loss net,得到第j层卷积层输出特征图Cj x Hj x Wj。将每个通道视作一个独立的样本Hj x Wj,则Gram matrix可以视作,求Cj个样本的无中心化协方差矩阵。对应到某两个样本间的计算则是:对应元素相乘后累加,除以CjHjWj。

也可以将特征图转换为Cj x HjWj(相当于将图片转换为向量),然后计算:

最后用F-范数计算两个Gram Matrix的距离:

F-范数是求矩阵的各项元素的绝对值平方和,然后开根号。

 

最后:

yc是content图片,ys是style图片,y用白噪声初始化。

 

Experiments

Baseline是风格转换的经典论文A neural algorithm of artistic style,使用的是pixel loss:

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Real-ESRGAN是一种超分辨率网络,全称为Enhanced Super-Resolution Generative Adversarial Networks。该网络通过训练以PSNR为导向的Real-ESRNet模型,然后以Real-ESRNet的网络参数进行初始化,同时使用L1 loss、perceptual loss和GAN loss作为损失函数来训练最终的Real-ESRGAN网络。 Real-ESRGAN被用作一种图像分辨率修复工具,可以提升照片和动画图片的分辨率。它内置了一个预训练模型,能够将分辨率提高到原来的4倍。虽然Real-ESRGAN是一个命令行工具,但使用起来非常简单,而且效果也非常好。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [Real-ESRGAN超分辨网络](https://blog.csdn.net/weixin_46515047/article/details/119829454)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [Real-ESRGAN 深度学习超分辨率重建工具](https://download.csdn.net/download/hq10086/79831404)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值