一次想要运行https://github.com/batra-mlp-lab/visdial-rl的泪目经历
基于文章Learning Cooperative Visual Dialog Agents with Deep Reinforcement Learning(可以自行搜索下载)
因为用的是学校的云主机,之前还为搞代理搞了半天,最后发现好像连校园网就行(dog)
在ubuntu18.04环境下运行
获取源码
git clone https://github.com/batra-mlp-lab/visdial-rl.git visdial-pytorch
安装环境
yml是环境配置文件,运行此命令可以直接创建conda环境
记得提前装好anaconda
conda env create -f env.yml
会出现报错
ResolvePackageNotFound:
- nccl==1.3.4=cuda8.0_1
- cudatoolkit==8.0=3
可以直接将yml中的报错部分删掉,也可以不运行yml这一步,需要安装的包使用pip即可
若成功运行yml文件,会给你创建出一个名为visdial-rl-pytorch的conda环境
git clone https://github.com/torch/distro.git ~/torch --recursive
下载visdial数据集
cd data/
python prepro.py -version 0.5 -download 1
运行时根据报错会安装h5py,nltk等库
下载visdial数据库的过程可能会经历很很很很久
最后下出了这么几个文件
然后使用VGG-19或ResNet去提取图像特征,这两个都要下载一些文件,不知道是什么原因VGG那个下载不下来
一直连接不上,就因为这个问题我甚至把翻墙软件卸载重装(搞得我以为它出了什么大病)
有时候就奇迹般的连上了,但会按着按着卡住
然后我就放弃了去装Reset
这个倒是很顺利
然后试图去运行
就是因为下面这个报错我才开始了这篇博客,查了很多东西觉得很乱,就来理一理顺序
module 'nn' not found
解决过程
luarocks install nn
报错
fatal error: nanomsg/nn.h: No such file or directory
https://blog.csdn.net/Adam_liu94/article/details/79654614
安装torch
git clone https://github.com/torch/distro.git ~/torch --recursive
报错
fatal: unable to access 'https://github.com/torch/distro.git/': gnutls_handshake() failed: The TLS connection was non-properly terminated.
解决
sudo vim /etc/resolv.conf
注意加上sudo 不加sudo的话没有writing权限
在文件中添加
nameserver 8.8.8.8
再次运行即可成功git clone
经过很长时间后
git clone完成
进入torch文件夹,打开并执行install-deps
bash install-deps
报错
E: Package 'python-software-properties' has no installation candidate
一直报这个错,搜索到是因为被software-properties-common代替,但按下面的命令安装后也还是报错
sudo apt-get install software-properties-common
最后把install-deps文件中安装python-software-properties的命令行删去,可以成功执行
无论如何总算是执行到命令的最后一行,能不能用后面再说
执行
./install.sh
sudo apt-get install libnanomsg-dev
sudo luarocks install nn
配了很多乱七八糟的东西,然后突然就成功了(太奇怪了)
一些有用的参考
https://www.bbsmax.com/A/nAJvAvoGzr/
https://blog.csdn.net/tjusxh/article/details/48372237
回到原程序运行时又有了新的报错
cd data
th prepro_img_resnet.lua -imageRoot /path/to/coco/images -cnnModel /path/to/t7/model -gpuid 0
module 'image' not found:
安装image失败的话,先去github上下载下来再安装
还是会报奇怪的错,搜到的说是因为按torch时少装了东西
泪目了
回去重新运行了一下,确实。。。
救不活了
下次见
在bash install-deps中有一个No module named IPython
的warning,并且直接用pip安装不上
在conda环境中使用conda安装解决
conda install IPython