5-18日工作学习内容

学习目标:

  • 修改controller的注释和方法名然后提交到服务器
  • pycharm实现git操作
  • 了解Slurm作用及使用方法
  • 了解Linux
  • 修改毕设

学习内容:

1.pycharm更新远程gitlab代码参考链接
2.了解slurm作用及使用方法:可以参考这个
(1)slurm是开源的集群管理和Linux集群作业调度系统,主要实现为用户分配独占或非独占的计算资源;提供框架用于在分配的节点集上启动执行、监视工作,一般是并行作业任务;管理挂起的工作队列仲裁资源争夺问题。由中央控制器(slurmctId)和守护进程(slurmd)构成。中央控制器负责备份、监视资源状态、管理job队列和分配资源任务;守护进程负责启动并管理任务(task)。
(2)使用

交互式作业提交批处理作业实时分配模式作业
srunsbatchsalloc

在这里插入图片描述
(3)Slurm常用命令
scancel:取消排队或运行中的作业或作业步,例如:scancel 0001
squeue:显示队列中的作业及作业步状态,例如:squeue -u user
sinfo:显示队列或节点状态
srun –N3 gpustat -> 访问全部节点,返回响应的前三个节点执行命令的结果
scontrol:显示或设定Slurm作业、队列、节点等状态,例如:scontrol show job 0001
(4)注意事项
确保–gres=gpu:0加在命令或sbatch的脚本上,不然默认分配全部gpu;
确保–time=xxx加上,给自己的程序或脚本加一个合理的时间,不然有的程序死循环可能会一直占用资源;
确保CUDA_VISIBLE_DEVICES 不用,他会绕过slurm 资源分配,抢占别人的资源;
确保申请资源不用后及时释放掉
3.了解Linux参考视频
(1)GNU/Linux在这里插入图片描述
(2)挂载点(mount point):利用一个目录当成进入点,将磁盘分区的数据放置在该目录下,进入该目录便可读取该分区,进入点的目录称为挂载点。
(3)各种文件夹的作用(一切皆文件)
bin: binary,存放直接可以执行的常用命令
sbin: 超级用户系统管理用使用的
lib:library,存放系统和应用程序需要的共享库文件
usr:包含用户所有的应用程序和所需要的文件和数据
boot:挂载引导分区用到的,用户数据不要写在这儿(比较小)
dev:device,设备目录,管理所有设备
etc:系统管理需要的配置文件
home:每个用户都有自己的主目录
root:系统超级管理员的主目录
opt:optional,当前系统给第三方软件包提供的目录
media:识别可移动媒体设备
mnt:挂载目录
proc:process,进程目录
run:当前系统运行以来的信息
srv:service,存放系统服务相关的
sys:系统硬件信息的相关文件
tmp:临时目录
var:variable,存放不断会扩充变化的东西,比如日志等
(4)shell常用基本命令
·shell是一个命令解释器,提供交互式的文本控制台界面,可以通过终端控制台来输入命令,由shell进行解释并最终交给内核执行。
·bin下面有一个sh的命令,是shell的入口,bashshell是一个交互式命令解释器程序。dash也是一个shell工具
现用现搜吧,不看了~


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值