深度有趣 | 19 pix2pix图像翻译

最新推荐文章于 2024-07-28 22:27:54 发布

张宏伦

最新推荐文章于 2024-07-28 22:27:54 发布

阅读量1.1k

点赞数

分类专栏：深度有趣文章标签：人工智能深度学习计算机视觉图像翻译 TensorFlow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhl493722771/article/details/82782211

版权

本文介绍了基于CGAN的pix2pix模型，用于配对图像翻译任务，如街道标注转实景、黑白图片上色等。文章详细阐述了pix2pix的原理、实现、模型结构和训练过程，并提供了数据集、预训练模型和代码资源，便于读者进行实践操作。同时，展示了使用pix2pix进行风景图片上色的应用效果。

摘要由CSDN通过智能技术生成

简介

介绍基于CGAN的pix2pix模型，可用于实现多种配对图像翻译任务

原理

配对图像翻译包括很多应用场景，输入和输出都是图片且尺寸相同

街道标注，街道实景
楼房标注，楼房实景
黑白图片，上色图片
卫星地图，简易地图
白天，夜晚
边缘，实物

图像翻译应用场景举例

pix2pix提供了一种通用的技术框架，用于完成各种配对图像翻译任务

作者还提供了一个在线Demo，包括曾经火爆一时的edge2cat，https://affinelayer.com/pixsrv/

pix2pix原理如下，典型的CGAN结构，但G只接受一个固定的输入X，可以理解为一个条件C，即不需要随机噪音，然后输出翻译后的版本Y

D接受一个X（CGAN中的C）和一个Y（真假样本），并判断X和Y是否为配对的翻译

pix2pix原理图

除了标准的GAN损失函数之外，pix2pix还考虑了生成样本和真实样本之间的L1距离作为损失

$L_{L_1}(G)=\mathbb{E}_{x\sim p_x,y\sim p_y}[\left \| y-G(x) \right \|_1]$

最低0.47元/天解锁文章

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。