解决方法:使用
ps aux|grep python
查看python进程,然后按照顺序执行
kill -9 PID
- pytorch GPU显存优化策略
- logger同时写入文件和控制台
https://discuss.pytorch.org/t/multiprocessing-failed-with-torch-distributed-launch-module/33056
- DDL(distributed data parallel) 中的rank和world size
https://pytorch.org/tutorials/intermediate/dist_tuto.html#initialization-methods
- ssh key 免密登录linux服务器
win cmd下输入命令:
ssh-keygen -t rsa
产生公钥(id_rsa.pub)和密钥(id_rsa)
然后将公钥上传到linux服务器的.ssh文件夹(没有需要创建),通过命令
cat id_rsa.pub >> authorized_keys
生成ssh key