1、登录并上传数据及程序文件
以用户user2为例:
登录后可用pwd命令查看当前位置:/home/user2,该目录不可存放文件
数据存放位置:/appdata3/user2
程序存放位置:/data1/user2
分别在该两个目录下建立自己的文件夹
ssh 210.47.18.250 -l user2
传输文件
scp --自己的本地文件地址------ ------上传集群地址------
scp /home/f/project/emotion.zip user5@210.47.18.250:/appdata3/user5/z
2、编写脚本:
例如:
将编写脚步上传至python运行文件同目录下
3、任务投递:
qsub job.sh
注:该登录节点没有可用GPU,需将任务投递至有GPU的计算节点上,目前共有9、10、11、12四个可用GPU计算节点
4、conda相关设置
(1)查看conda当前所支持的环境:conda env list。
(2)进入conda相应环境:conda activate tensorflow。
(3)缺少相应的包无法运行程序:conda install xx,其中’xx’,即需要安装的包名。
5、查看任务情况:
qstat # 任务查询
qstat –f # 队列查询
6、查看任务结果
当前目录下:(/export/home/user2)
job.sh.oxx # stdout 标准输出结果
job.sh.exx # stderr 标准错误输出
注:xx表示jobid,即任务编号