[pix2pix]Image-to-Image Translation with Conditional Adversarial Networks阅读笔记

1、任务

        1) image-to-image translation

        2) common framework,适用于各种场景

2、网络

        (image) conditional GANs (cGANs):image x + random noise vector z -> y

                                                        

        1) Generator

                基于U-Net的结构

        2) Discriminator

                卷积"PatchGAN"分类器,输入包括Generator的输入

                关注以N x N的patch为单位的真实性,从而有助于学习到高频特征

                相当于texture/style loss

        3) loss

                                ​​​​​​​        ​​​​​​​        

                a) GAN loss (high-frenquency structure)

                                           

                 其中,Generator尝试最小化该loss,Discriminator尝试最大化该loss,即

                                                   

                b) L1 loss (low-frenquency structure)

                                                      

                 Generator应当最小化该loss                               

3、训练和优化过程

        1) Discriminator和Generator依次进行

        2) 最小化 -> 最大化

        3) Discriminator的loss/2,使得Generator的学习速度更快

        4)minibatch SGD,Adam solver,lr=0.0002,momentum_beta1=0.5,momentum_beta2=0.999

4、测试/推断

        1) 应用drop out

        2) BN使用测试batch的参数(BS=1时相当于IN,对图像生成很有帮助)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值