StackGAN论文阅读

next 猫

于 2022-04-24 16:40:22 发布

阅读量2.1k

点赞数

文章标签：开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46465532/article/details/124255762

版权

StackGAN是一种新型的堆叠生成对抗网络，解决了文本到高清图像生成的挑战。它通过两个阶段逐步生成高分辨率图像，改善了样本细节和多样性。通过条件增强技术和残差块设计，StackGAN在CUB、Oxford-102和MS COCO等数据集上的实验展示了其优越性能。

摘要由CSDN通过智能技术生成

1.目标

完成把文本转化成高清图像的任务。

2.面对的困难

①现有的方法生成的样本会有细节缺失。②高分辨不容易被实现。如果只是在GAN模型中添加更多的上采样层来生成高分辨图像会产生无意义的输出。还有自然图像的分布与模型分布在高维空间上可能不会重叠。

ps:上采样主要目的：放大原图像，从而提高分辨率。

下采样主要目的：①使得图像符合显示区域的大小。②生成对应图像的缩略图。

3.完成的工作

1）提出了一种新的堆叠生成对抗网络，用于从文本描述合成照片真实感图像。它将生成高分辨率图像的难题分解为更易于管理的子问题，并显著提高了技术水平。StackGAN首次生成256*256分辨率，带有来自文本描述逼真细节的照片。

2）提出了一种新的条件增强技术来稳定条件GAN训练，并提高了生成样本的多样性。

3）大量的定性和定量实验证明了整体模型设计的有效性以及各个组件的影响。

4.StackGAN

本文将文本转化成图像的任务分为两部分：第一阶段，根据文本绘制物体的原始形状和基本颜色，并从随机噪声向量中绘制背景图，生成低分辨率的图像。第二阶段，修正第一阶段生成的低分辨率图像，再次读取文本来完成对象的细节，生成高分辨的图像。

1）条件增强技术（CA)

目的：改善生成图像的多样性，稳定conditional-GAN的训练过程，使得隐含条件更加平滑。

方法：文本描述首先由编码器编码，产生文本的embedding。以前的工作中，文本嵌入非线性的转化成为潜在条件作为生成器的输入。这样的做法中，文字的潜在空间的embedding通常是高维的，在数据有限的时候，数据流性通常是不连续的。这是不可取的。本文引入条件增强技术来产生额外的条件变量，这个条件变量不是固定的，是从独立的高斯分布随机的采样而来的。其中的平均值和对角协方差矩阵是文本embedding的函数。为了强化条件流行并避免过拟合，作者在训练时在生成器里添加了以下正则项：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
StackGAN论文阅读

1.目标完成把文本转化成图像的任务。2.面对的困难①现有的方法生成的样本会有细节缺失。②高分辨不容易被实现。如果只是在GAN模型中添加更多的上采样层来生成高分辨图像会产生无意义的输出。还有自然图像的分布与模型分布在高维空间上可能不会重叠。ps:上采样主要目的：放大原图像，从而提高分辨率。下采样主要目的：①使得图像符合显示区域的大小。②生成对应图像的缩略图。3.完成的工作1）提出了一种新的堆叠生成对抗网络，用于从文本描述合成照片真实感图像。它将生成高分辨率图像的难题分解为更易于管理
复制链接

扫一扫

next 猫 CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

53万+: 周排名

153万+: 总排名

3万+: 访问

: 等级

228: 积分

22: 粉丝

21: 获赞

6: 评论

185: 收藏

私信

关注

热门文章

最新评论

汇编语言（王爽）-实验
爱拼才会赢32: 实验五压缩到九行那个段地址给错了，是 20h
汇编语言（王爽）-实验
慕衍＞: 请问为什么第二题的第三问data段地址为x-2，stack段为x-1，是如何判断出来的呢
制作注册机
narukuuuu: 博主你好 keymake能分享一下吗
StackGAN论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
WinDbg常用指令
果优: 请问为什么dp的结果中第一个值是ffd80166，但db命令结果的顺序是66 01 d8 ff，而不是ff d8 01 66呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。