【PyTorch】PyCharm远程连接服务器，调试torch.distributed.launch分布式程序

最新推荐文章于 2023-09-16 20:07:23 发布

Katherine121

最新推荐文章于 2023-09-16 20:07:23 发布

阅读量1.9k

点赞数 6

分类专栏：深度学习文章标签： pycharm pytorch 服务器分布式

本文链接：https://blog.csdn.net/qq_45792472/article/details/127807086

版权

5 篇文章 0 订阅

订阅专栏

注意，本文章仅适用于远程连接服务器进行调试的情况

在服务器控制台，你的项目的上一级目录，输入如下命令：

ln -s /home/username/miniconda3/envs/virtualenv_name/lib/python3.6/site-packages/torch/distributed/ yourproject

之后，进入你项目的目录，输入ls，你将在项目文件夹下看见一个蓝色的distributed文件夹，说明软链接成功

在这里插入图片描述

通过PyCharm的deployment功能，将远程yourproject/distributed文件夹下载到本地

修改PyCharm设置

点击edit configurations
在script设置里面输入你本地项目文件夹的launch.py路径，
因为这里只能选择本地文件，所以我们之前把distributed文件夹下载到本地就起作用了，直接选择即可
因为软链接成功了，所以使用本地的launch相当于远程的launch
修改parameters，只需要删除原来的运行脚本中的python -m torch.distributed.launch，其他不变
修改环境变量，加入CUDA_VISIBLE_DEVICES=0,1
其他不变，点击确定，点击run->debug train.py完成调试

界面如图所示
在这里插入图片描述

关注