深度有趣 | 19 pix2pix图像翻译

本文介绍了基于CGAN的pix2pix模型,用于配对图像翻译任务,如街道标注转实景、黑白图片上色等。文章详细阐述了pix2pix的原理、实现、模型结构和训练过程,并提供了数据集、预训练模型和代码资源,便于读者进行实践操作。同时,展示了使用pix2pix进行风景图片上色的应用效果。
摘要由CSDN通过智能技术生成

简介

介绍基于CGAN的pix2pix模型,可用于实现多种配对图像翻译任务

原理

配对图像翻译包括很多应用场景,输入和输出都是图片且尺寸相同

  • 街道标注,街道实景
  • 楼房标注,楼房实景
  • 黑白图片,上色图片
  • 卫星地图,简易地图
  • 白天,夜晚
  • 边缘,实物

图像翻译应用场景举例

pix2pix提供了一种通用的技术框架,用于完成各种配对图像翻译任务

作者还提供了一个在线Demo,包括曾经火爆一时的edge2cat,https://affinelayer.com/pixsrv/

pix2pix原理如下,典型的CGAN结构,但G只接受一个固定的输入X,可以理解为一个条件C,即不需要随机噪音,然后输出翻译后的版本Y

D接受一个X(CGAN中的C)和一个Y(真假样本),并判断X和Y是否为配对的翻译

pix2pix原理图

除了标准的GAN损失函数之外,pix2pix还考虑了生成样本和真实样本之间的L1距离作为损失

L L 1 ( G ) = E x ∼ p x , y ∼ p y [ ∥ y − G ( x ) ∥ 1 ] L_{L_1}(G)=\mathbb{E}_{x\sim p_x,y\sim p_y}[\left \| y-G(x) \right \|_1] LL1(G)=

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值