超算中心简介
网址:http://hpc.whu.edu.cn
操作系统:x86_64架构的64位CentOS 7.5 Linux
GPU集群:400块Nvidia Tesla V100,峰值计算能力3000万亿次/秒,100G OPA互联
申请流程
老师和学生分别申请免费账户,通过后会收到邮件,邮件里提供了用户名、ip和初始密码,然后参照http://hpc.whu.edu.cn/sjfw/ffsq.htm 发送申请表到官方邮箱,所属超算用户填写老师的用户名,超算用户填写学生的用户名,申请通过后会收到邮件,记得加入官方qq群137281704
用户空间介绍
home 1G 储存环境变量 长期保存
project 1TB 项目文件和运行作业
workfs 3TB 超过3个月会自动清理, 建议不用
磁盘查询命令
lfs quota -uh jrhu /home/jrhu
lfs quota -uh jrhu /project/jrhu
fee
校内用户 0.06 元/核/h ; 1 元/卡/h
算上cpu 基本一卡一小时 2.5元
login node
202.114.96.180
file node
千兆带宽的传输节点 202.114.96.177
常用命令
使用gpu
srun -A panjun --gres=gpu:1 -p gpu -u python train.py
查看残留进程
非常重要 没事就检查一下
squeue -u jrhu
kill 残留进程
scancel <job id>
查看预装软件
module avail
soft link
data download workplace .cache .conda .ipython .torch
比如
ln -s project/data data