之前我是用强化学习做baxter机器人移动物体抓取的,后来导师觉得那个方向差不多到顶了,再做就没啥意义了(两个师兄做这个了,也都发了不错的论文),让我做复杂场景抓取,妄我去年学习了一年啊/(ㄒoㄒ)/~~都快做出来了,不过导师这么说了,我也恭敬不如从命,选择了一篇比较接近的文章来复现他,安排!
在我上一篇文章中我就写到,我们实验室的这个电脑有点不兼容ubuntu16.04+2080ti,火狐打不开,chrome经常崩溃~~~无解,在配置环境时出现了很多问题。
尤其是按照作者的方法进行训练时出现了一个报错
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED
VREP中,机械臂不训练,于是我拿到了我隔壁的那台1080ti上,训练的呼呼的,查了一下原因是cudnn,cuda,torch,torchvision版本之间不兼容导致的!
在1080ti上无障碍运行的环境是cuda9.0、cudnn7.1.2、torch1.0.1 torchvision0.2.2
经过摸索,最终得出在2080ti上无障碍运行的环境是cuda10.0、cudnn7.6.4、torch1.2.0、torchvision0.4.0
下面介绍安装步骤(感谢小小玺先生这个老叼的指导)
一.查看cuda版本
conda list cuda
查看cudnn版本
conda list cudnn
查看安装了那些东西
pip list
然后把当中的这四大金刚都卸了(卸载cudatollkit与cuda类似)
pip uninstall torch
pip uninstall torchvision
conda uninstall cuda
conda uninstall cudnn
二.在安装这四大金刚之前,先安装好anaconda,这个按网上的方法安装即可,然后source activate p37
进入这个环境进行安装(我命名是p37哈,也就是python3.7,你们命名随意)。在这个环境下一切准备就绪,开始安装,网上的方法太复杂了,直接用命令安装即可(可以用conda search cudatoolkit
查看哪些cuda版本可以安装),
1.安装cudatoolkit我们选择10.0.130,输入yes继续即可
conda install cudatoolkit=10.0.130
2.安装cudnn
conda install cudnn=7.6.4
3.安装torch和torchvision(我添加了一个地址,速度瞬间挠挠的)
pip install torch==1.2.0 torchvision==0.4.0 -f https://download.pytorch.org/whl/cu100/torch_stable.html
给你们看看用pip install torch==1.2.0 torchvision==0.4.0
安装时的速度,当然如果你这种方法速度快,那当我没说~
4.我们尝试一下论文中的步骤
python main.py --is_sim --push_rewards --experience_replay --explore_rate_decay --save_visualizations --load_snapshot --snapshot_file '/home/ming/visual-pushing-grasping/logs/2021-09-13.15:29:54/models/snapshot-backup.reinforcement.pth' --continue_logging --logging_directory '/home/ming/visual-pushing-grasping/logs/2021-09-13.15:29:54'
芜湖,起飞!
总结
我觉得大家的ubuntu16.04最好还是配1080ti吧,能省去很多麻烦。
最后
在花椒50周年校庆之际,祝花椒越来越好,我越来越帅。