GAN系列(五) —— Text2Img文本生成图像

最新推荐文章于 2024-05-31 16:59:58 发布

hxxjxw

最新推荐文章于 2024-05-31 16:59:58 发布

阅读量2.3k

点赞数 1

文章标签：文本生成图像 GAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hxxjxw/article/details/108029085

版权

文本生成图像的GAN网络结构

文本生成图像的问题难点

多样化

一个描述对应多张图，搜索空间比图像生成文本更大
一个词的变化图就会发生很大的变化

文本生成图像的任务

生成真实的图像
生成与文字匹配的图像

模型结构

G

输入：随机向量+文本编码
输出：图像

D

输入：生成图像+文本编码
输出：图像与文本是否匹配+图像是否真实

文本是向量，不能当作图像来处理，这是和其他GAN不同的一个地方

应用的技巧

①分步，先将图像是否合理训练出来，再训练图像文本是否匹配

②除了<假图，描述>和<真图、描述>之外，添加<真图，不匹配描述>

算法流程

效果

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
GAN系列(五) —— Text2Img文本生成图像

文本生成图像的GAN网络结构文本生成图像的问题难点多样化一个描述对应多张图，搜索空间比图像生成文本更大一个词的变化图就会发生很大的变化文本生成图像的任务生成真实的图像生成与文字匹配的图像模型结构G输入：随机向量+文本编码输出：图像D输入：生成图像+文本编码输出：图像与文本是否匹配+图像是否真实文本是向量，不能当作图像来处理，这是和其他GAN不同的一个地方应用的技巧①分步，先将图像是否合理训练出来，再训练图像文本是...
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。