本来在自己的2080s和工作站的2080ti上跑的挺好的,用3090出现了各种错误。。主要还是因为跑Transformer系列代码需要的显存比较高,想用实验室的3090跑一跑,毕竟显存有24G。
一、virtualenv环境
用这个环境总是会报错AttributeError: 'Version' object has no attribute 'release'
网上解决方法比较少,可以参考此链接https://github.com/dephell/dephell_specifier/issues/9
二、anconda环境
最终还是用了anconda配置的虚拟环境。。(一开始不用是因为之后会和ROS产生冲突)
我是直接将一台电脑里的anconda3/envs
里的虚拟环境直接拷贝过去的
主要的区别是由于3090的算力比较高,于是升级为:toch1.7.0+cu110
随后更新mmcv-full,这里可以根据torch和cudn版本选择对应版本的
https://codechina.csdn.net/mirrors/open-mmlab/mmcv?utm_source=csdn_github_accelerator
于是根据自己的版本执行
pip install mmcv-full=={mmcv_version} -f https://download.openmmlab.com/mmcv/dist/cu110/torch1.7.0/index.html
这里报错/XXX/bin/pip: 解释器错误: 没有那个文件或目录
于是我进入到相应的地方查看pip文件
把第一行的地址做相应的修改即可。
随后继续运行mmcv-full安装代码,报错ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output
一开始实在不知道哪错了。。后来发现原来是没有安装pytest-runner
(一定要通读错误!!!)
执行如下代码:
pip install --user pytest-runner
再执行mmcv-full安装文件就可以啦!
中间还有许许多多其他奇怪的问题就没有记录了,主要就是上面几个问题,有其他问题的话也可以问我~