我跑这个模型的时候没查到教程,走了不少弯路,发出来避一下坑吧
如果你使用colab运行,可以直接按照我写好的运行代码跑了:但是需要colab pro开高RAM
如果不是试用colab在本地运行,需要先安装好cuda环境
受限,把模型文件克隆下来,如果没有安装git指令可能要先安装
cd进入CogView目录(不一定是我写的这样)
git clone https://github.com/THUDM/CogView.git
cd Cogview
安装一些包
pip install deep_translator lmdb
pip install -r CogView/requirements.txt
安装apex:
git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
输入上面这三行指令以安装,如果安装成功那你就成功安装了apex
当然大概率是安装失败的,此时参照:
解决在CoLab中配置apex时遇到的No module named 'fused_layer_norm_cuda'问题 - 知乎
的解决方式即可
——————————————————————————
安装好apex后继续安装其他
返回上级目录:cd ..
进入CogView目录:cd CogView
下载vqvae
wget "https://www.dropbox.com/s/lk78djywfdw9na1/vqvae_hard_biggerset_011.pt?dl=1" -O pretrained/vqvae/vqvae_hard_biggerset_011.pt
下载pretrain的模型参数
wget "https://the-eye.eu/public/AI/CogView/cogview-base.tar" -O /content/cogview-base.tar
解压至
tar -xvf /content/cogview-base.tar -C pretrained/cogview/
恭喜你配置好了所有内容,可以开始运行啦!在运行前根据GPU和内存配置,需要进入scripts/text2image.sh文件里修改
可以把数字写成1,这样我的V100也能跑
顺便,如果想用交互模式,输入句子而不是创建input.txt的话,这里也修改成他的要求~
如果不用交互模式的话~
在CogView这个目录创建一个input.txt文件,在里面每一行输入一个你想要生成的东西
eg:
一只猫在跳舞
我在天上飞
保存后即可运行
!scripts/text2image.sh --debug