遇到的问题:
在服务器上配环境
流程:
先安装anaconda(去其官网下载个脚本文件到服务器上,然后启动脚本即可)
bash Anaconda3-5.3.1-Linux-x86_64.sh
然后创建 python环境
conda create -n pytorch python=3.10
去pytorch官网选择合适自己cuda版本的pyorch
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=10.2 -c pytorch
下载jupyter,
pip install jupyter
端口映射课远程调用
ssh -L 8888:localhost:8888 hyw@10.16.103.249
tensorboard --logdir=log1
ssh -L 6006:localhost:6006 hyw@10.16.103.249
1.学长教的是默认配的conda环境,其他pytorch啥的还是要自己配。
2.我自己create的conda虚拟环境里面有3个版本的python,只有python3.9的那个才配了pytorch环境的是能用的。
3.找pyhon3.9的环境路径
where is python
conda常用命令
conda update conda
conda --version
conda remove -n 环境名字
conda env list
torch.cuda.is_available()
nvidia-smi
lshw -c video
watch -n 1 -d nvidia-smi
服务下图片保存报错
#...
plt.show()
#解决方法:
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt
#...
#最后不要用show()的方法了,直接保存图像
plt.savefig('myfig')
#这时你回到文件夹就会发现有一个myfig.png的图片
pycharm每次远程新建项目
都需要修改解释器设置,主要是改映射地址和sftp的地址
在项目中新建文件是需要修改调试器中的映射地址,解释器选择项目默认。
选择现有
在服务器上获取DISPLAY端口
echo $DISPLAY
Screen常用命令
screen -S train 发起
screen -ls
screen -r train 恢复屏幕
screen -S 11279.train -X quit 关闭
ctrl a+d 切换