四步快速配置一个简单高效的文本生成图像基准模型DF-GAN2020版本 T2I baseline

本文将介绍一个简单高效的文本生成图像基准模型,该基准模型是DF-GAN20版代码,清楚简单,实用性高,本基准模型代码在他的基础上经过少量简化和处理,虚拟环境也进行了打包,非常适合作为一个基线模型,然后在其上进行对应创新。

一、下载代码

代码地址:https://github.com/Heavenhjs/demot2i.git
下载方法:git clone https://github.com/Heavenhjs/demot2i.git或者进入github下载压缩包
下载后的代码结构如下:
在这里插入图片描述
其中:code文件夹放置模型主要代码,data放置数据集(如bird、coco),DAMSMencoders放置已经训练好的文本编码器和图像编码器。

二、配置虚拟环境

点击下载已经打包好的虚拟环境demoEnv,将其放到Anaconda安装目录下的envs中,无需解压。比如D:\Anaconda3\envs:
在这里插入图片描述
放入之后可以在anaconda prompt或者pycharm终端中输入:conda info --envs,如果显示有demoEnv则成功导入虚拟环境:
在这里插入图片描述

三、配置数据集

数据集已经打包上传至OneDrive,下载数据集CUB-Bird,替换代码项目的data文件夹:
在这里插入图片描述

四、开始运行

最终配置好的项目结构如下:
在这里插入图片描述
其中code/cfg里的yml文件存放模型的一些参数,code/miscc文件夹存放模型的选项和工具函数,DAMSM是深度注意多模态相似模块,dataset用于处理数据和加载dataloader,main是项目的入口文件,model是模型文件。

运行:
1、激活demoEnv环境:conda activate demoEnv
2、进入code目录,开始运行,模型进入训练:python main.py --cfg cfg/bird.yml
3、训练好了之后,将code/cfg/bird.yml中的B_VALIDATION 改为True,然后进入采样:python main.py --cfg cfg/bird.yml

最后

💖 个人简介:人工智能领域研究生,目前主攻文本生成图像(text to image)方向

📝 关注我:中杯可乐多加冰

🔥 限时免费订阅:文本生成图像T2I专栏

🎉 支持我:点赞👍+收藏⭐️+留言📝

如果这篇文章帮助到你很多,希望能点击下方打赏我一杯可乐!多加冰哦

  • 8
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 22
    评论
评论 22
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

中杯可乐多加冰

请我喝杯可乐吧,我会多加冰!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值