避坑:教程:怎么运行CogView模型(text2image)

我跑这个模型的时候没查到教程,走了不少弯路,发出来避一下坑吧

如果你使用colab运行,可以直接按照我写好的运行代码跑了:但是需要colab pro开高RAM

​​​​​​​​​​​​https://colab.research.google.com/drive/1tXn1wrHg8SNzEFLmn4jbCboUTTScZzCM#scrollTo=dU5UJbzN3w4M​​​​​​​r

如果不是试用colab在本地运行,需要先安装好cuda环境

受限,把模型文件克隆下来,如果没有安装git指令可能要先安装

cd进入CogView目录(不一定是我写的这样)

git clone https://github.com/THUDM/CogView.git
cd Cogview

安装一些包

pip install deep_translator lmdb

pip install -r CogView/requirements.txt

安装apex:

git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
 
输入上面这三行指令以安装,如果安装成功那你就成功安装了apex

当然大概率是安装失败的,此时参照:

解决在CoLab中配置apex时遇到的No module named 'fused_layer_norm_cuda'问题 - 知乎

的解决方式即可

——————————————————————————

安装好apex后继续安装其他

返回上级目录:cd ..

进入CogView目录:cd CogView

下载vqvae

wget "https://www.dropbox.com/s/lk78djywfdw9na1/vqvae_hard_biggerset_011.pt?dl=1" -O pretrained/vqvae/vqvae_hard_biggerset_011.pt

下载pretrain的模型参数

wget "https://the-eye.eu/public/AI/CogView/cogview-base.tar" -O /content/cogview-base.tar

解压至

tar -xvf /content/cogview-base.tar -C pretrained/cogview/

恭喜你配置好了所有内容,可以开始运行啦!在运行前根据GPU和内存配置,需要进入scripts/text2image.sh文件里修改

可以把数字写成1,这样我的V100也能跑

顺便,如果想用交互模式,输入句子而不是创建input.txt的话,这里也修改成他的要求~

如果不用交互模式的话~

在CogView这个目录创建一个input.txt文件,在里面每一行输入一个你想要生成的东西

eg:

一只猫在跳舞

我在天上飞

保存后即可运行

!scripts/text2image.sh --debug

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值