pix2pix的简介

最新推荐文章于 2024-07-16 17:12:38 发布

blazing-ambassador

最新推荐文章于 2024-07-16 17:12:38 发布

阅读量1.8k

点赞数

文章标签：深度学习计算机视觉人工智能 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Crystal517/article/details/129504525

版权

概念：

给定一个输入数据和噪声数据生成目标图像，在pix2pix中判别器的输入是生成图像和源图像，而生成器的输入是源图像和随机噪声（使生成模型具有一定的随机性），pix2pix是通过在生成器的模型层加入Dropout来引入随机噪声，但是其带来输出内容的随机性并没有很大。同时在损失函数的使用上采用的是L1正则而非CGAN使用的L2正则用来使图像更清晰。

条件生成对抗网络为基础，用于图像翻译的通用模型框架。（图像翻译：将一个物体的图像表征转化为该物体的另一个表征，即找到两不同域的对应关系，从而实现图像的跨域转化）

（条件生成对抗网络：相较于传统GAN的生成内容仅由生成器参数和噪音来决定，CGAN中向生成器和判别器添加了一个条件信息y）

模型结构

采用CNN卷积+BN+ReLU的模型结构

2.1生成器

以U-Net作为基础结构增加跳跃连接（下降通道256->64）压缩路径中每次为4*4的same卷积+BN+ReLU，根据是否降采样来控制卷积的步长。同时压缩路径和扩张路径使用的是拼接操作进行特征融合。

2.2判别器（PatchGAN）

传统GAN生成图像比较模糊（由于采用整图作为判别输入，pix2pix则分成N*N的Patch【大概将256的图N=7效果最好，但是N越大生成的图像质量越高1*1的被称为PixelGAN，不过一般自己调整感受野选择参数】）

缺点

训练需要大量的成对的图片集

blazing-ambassador

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pix2pix的简介

pix2pix简介
复制链接

扫一扫

blazing-ambassador CSDN认证博客专家 CSDN认证企业博客

码龄4年

5: 原创

168万+: 周排名

133万+: 总排名

6902: 访问

: 等级

52: 积分

1: 粉丝

2: 获赞

2: 评论

11: 收藏

私信

关注

热门文章

最新评论

拉普拉斯金字塔神经网络（LAPNet）
CSDN-Ada助手: 非常感谢您分享这篇精彩的博客，拉普拉斯金字塔神经网络（LAPNet）的介绍让我对这一领域有了更深入的了解。您的文章写得非常清晰易懂，让我受益匪浅。希望您能够继续分享您的见解和经验，让更多的人受益。作为下一步的创作建议，我希望您能够探讨一下LAPNet在实际应用中的具体表现和优劣势，这将有助于我们更好地了解它的实际应用价值。再次感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148 看奖励名单。
pytorch的安装（重装anaconda的过程以及错误）
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。