【Image Processing Using Multi-Code GAN Prior 多码先验GAN】学习笔记

一、背景

无监督的GAN中,生成器G将噪音变量z映射到想要的真实图像x,但由于没把真实的图像作为输入,即没有使用训练好的模型进行后续的图像处理。

为了让训练好的GAN能用于处理图像,现有如下两种方法将真实图像x映射到噪音空间z:

  1. 重新反向传播(寻找合适的Z)
  2. 添加一个额外的编码器encoder

但多数情况下上述两种方式的重建并不理想,对此本文提出一种新的逆映射(x->z)的方法:将训练好的GAN作为一个有效的先验去对后续的图像进行处理。

二、多码先验GAN介绍

  1. 使用给定做逆映射的GAN模型,将噪声z生成多个特征图(映射到生成器G中的某个中间层)
  2. 计算生成的多个特征图的重要系数,并组合生成目标图像

优势:显著提高图像的重建质量,可以使得训练好的GAN作为一种先验应用于许多真实场景下的应用,例如:图像上色、超分辨率、图像修复、图像语义物体编辑等。

三、关键技术

1.GAN逆映射(GAN inversion)

无监督的GAN:从噪音空间z中采用合成高质量图像,z->image

GAN逆映射:为了恢复目标图像而寻找合适的噪音空间z,image->z

2.特征组合

单码的缺陷:

  • 分别使用face、church、conference room、bedroom四个数据集预训练PGGAN,并以此作为先验。使用单码去重建时,很难“覆盖先验”,出来的结果会呈现原训练集图像内容,而无法重建到目标图像。
  • 由于使用单码去重建目标图像的所有细节很难,对此使用多码的方式,可以将复杂任务进行细化地重建。

如何将多码结合一起优化,进行融合后重建?将生成器“分为”两部分,G1和G2,L是中间某层的特征输出,提出“自适应通道重要性”(Adaptive Channel Importance)。

 3.优化目标

重建损失使用的是MSE和VGG的感知损失距离:

四、应用

1.图像上色

2.图像超分

3.图像修复

参考:

CVPR2020之多码先验GAN:预训练模型如何使用?_公众号机器学习与生成对抗网络的博客-CSDN博客

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在单个图像去雾算法中,使用暗通道先验方法(matlab single image haze removal using dark channel prior)是一种常用的方法。 该方法利用了图像中的暗像素值数据来对图像中的雾进行估计和消除。在图像中,由于雾的存在,远处的物体会有较高的亮度减弱,而靠近观察点的物体则有较高的亮度增强。由于光照强度不均匀,较暗的像素通常代表空气中的雾浓度较低,而较亮的像素通常代表雾浓度较高。 暗通道先验方法的基本思想是,通过查找图像中的暗像素值,可以估计出该区域中的最小远景透射率。透射率是雾的浓度与雾气对光的散射强度之间的比例关系。通过估计最小透射率,可以推断出雾浓度的分布,从而进行雾的去除。这个估计过程可以通过计算图像每个像素点的一个小窗口内的最小像素值来实现。 具体的暗通道先验算法包括以下步骤: 1. 对输入的雾图像进行预处理,包括图像的亮度归一化和颜色空间转换。 2. 计算每个像素点对应的暗通道,即选择一个固定大小的窗口,在窗口内找到最小像素值。 3. 估计最小透射率,最常用的方法是使用暗像素值和其相应的原始像素值计算得到。 4. 通过估计的透射率和原始图像进行重建,可以得到去雾后的图像。 暗通道先验方法是一种简单但有效的去雾算法,可以在图像中消除大部分的雾效果,提高图像的清晰度和可见度。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值