四步快速配置一个简单高效的文本生成图像基准模型DF-GAN2020版本 T2I baseline

中杯可乐多加冰

已于 2023-12-11 09:51:16 修改

阅读量2.6k

点赞数 8

分类专栏：文本生成图像 text-to-image 文章标签：文本生成图像 T2I 人工智能深度学习 python

于 2022-08-10 18:14:16 首次发布

本文链接：https://blog.csdn.net/air__Heaven/article/details/126117813

版权

文本生成图像 text-to-image 专栏收录该内容

64 篇文章 428 订阅

订阅专栏

本文将介绍一个简单高效的文本生成图像基准模型，该基准模型是DF-GAN20版代码，清楚简单，实用性高，本基准模型代码在他的基础上经过少量简化和处理，虚拟环境也进行了打包，非常适合作为一个基线模型，然后在其上进行对应创新。

一、下载代码

代码地址：https://github.com/Heavenhjs/demot2i.git
下载方法：git clone https://github.com/Heavenhjs/demot2i.git或者进入github下载压缩包
下载后的代码结构如下：
在这里插入图片描述
其中：code文件夹放置模型主要代码，data放置数据集（如bird、coco），DAMSMencoders放置已经训练好的文本编码器和图像编码器。

二、配置虚拟环境

点击下载已经打包好的虚拟环境demoEnv，将其放到Anaconda安装目录下的envs中，无需解压。比如D:\Anaconda3\envs：
在这里插入图片描述
放入之后可以在anaconda prompt或者pycharm终端中输入：conda info --envs，如果显示有demoEnv则成功导入虚拟环境：

三、配置数据集

数据集已经打包上传至OneDrive，下载数据集CUB-Bird，替换代码项目的data文件夹：
在这里插入图片描述

四、开始运行

最终配置好的项目结构如下：
在这里插入图片描述
其中code/cfg里的yml文件存放模型的一些参数，code/miscc文件夹存放模型的选项和工具函数，DAMSM是深度注意多模态相似模块，dataset用于处理数据和加载dataloader，main是项目的入口文件，model是模型文件。

运行：
1、激活demoEnv环境:conda activate demoEnv
2、进入code目录，开始运行，模型进入训练：python main.py --cfg cfg/bird.yml
3、训练好了之后，将code/cfg/bird.yml中的B_VALIDATION 改为True，然后进入采样：python main.py --cfg cfg/bird.yml

最后

💖 个人简介：人工智能领域研究生，目前主攻文本生成图像（text to image）方向

📝 关注我：中杯可乐多加冰

🔥 限时免费订阅：文本生成图像T2I专栏

🎉 支持我：点赞👍+收藏⭐️+留言📝

如果这篇文章帮助到你很多，希望能点击下方打赏我一杯可乐！多加冰哦

中杯可乐多加冰

关注

8
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
22
评论
四步快速配置一个简单高效的文本生成图像基准模型DF-GAN2020版本 T2I baseline

本文将介绍一个简单高效的文本生成图像基准模型，该基准模型是DF-GAN20版代码，清楚简单，实用性高，本基准模型代码在他的基础上经过少量简化和处理，虚拟环境也进行了打包，非常适合作为一个基线模型，然后在其上进行对应创新。...
复制链接

扫一扫