slurm上使用jupyter

学习笔记总结

环境设置与脚本说明

  1. 创建 conda 环境

    conda create -n jupyter python=3.10
    mamba install -y jupyterlab
    
  2. SLURM 脚本 (start_jupyter.csh)

    #!/bin/bash
    #SBATCH --time=1-00:00:00  # 指定最大作业时间为 1 天
    #SBATCH -n 1                # 请求 1 个计算核心
    #SBATCH -N 1                # 请求 1 个计算节点
    #SBATCH -p Debug            # 提交作业到 Debug 分区
    #SBATCH -o logs/01-bsr2.%j.log  # 将标准输出保存到指定的日志文件
    #SBATCH -e logs/01-bsr2.%j.log  # 将错误输出也保存到同一日志文件
    #SBATCH --mail-type=FAIL,END  # 在作业失败或结束时发送邮件通知
    #SBATCH --mail-user=@qq.com  # 指定邮件接收地址
    
    # 获取隧道信息
    XDG_RUNTIME_DIR=""  # 清空 XDG 运行时目录环境变量
    port=$(shuf -i8000-9999 -n1)  # 生成一个随机端口号用于 Jupyter
    node=$(hostname -s)  # 获取当前节点名称
    user=$(whoami)  # 获取当前用户名
    cluster=$(hostname -f | awk -F"." '{print $2}')  # 获取集群名称
    
    # 设置 SSH 连接信息
    clusterurl="202.205.88.254"  # 远程服务器地址
    
    export PATH=$PATH:~/.local/bin  # 将本地 bin 目录添加到 PATH
    
    # 打印 SSH 隧道连接指令
    echo -e "
    MacOS 或 Linux 终端命令创建 SSH 隧道:
    ssh -N -L ${port}:${node}:${port} ${user}@${clusterurl}
    
    以下是 MobaXterm 信息:
    
    Forwarded port: 与远程端口相同
    Remote server: ${node}
    Remote port: ${port}
    SSH server: ${cluster}.${clusterurl}
    SSH login: $user
    SSH port: 22
    
    在本地浏览器上使用以下 URL 访问:
    localhost:${port} (使用密码时添加 https:// 前缀)
    
    或从错误文件中复制 token
    "
    
    # 激活环境并启动 Jupyter Notebook
    source activate jupyter  # 激活创建的 Jupyter 环境
    jupyter-lab --no-browser --port=${port} --ip=${node}  # 在指定端口和 IP 地址上启动 Jupyter Lab,不自动打开浏览器
    
  3. 访问 Jupyter

    • 在本地浏览器中使用 localhost:${port} 访问,必要时加上 https:// 前缀。

参考https://www.cnblogs.com/cookielbsc/p/12411560.html
https://nscc-neuro.github.io/nest-guide/docs/fqy4b2b061msp8gr/

对于slurm使用教程,你可以参考以下步骤: 1. 首先,确保你已经在你的系统上安装了slurm。你可以从slurm官网下载适合你系统的软件包。 2. 一旦安装完成,你需要配置slurm。你可以根据你的需求修改配置文件,如slurm.conf。这个文件包含了各种有关集群和作业调度的设置。你可以根据需要设置集群的节点、作业队列、资源限制等信息。 3. 在配置完成后,你可以启动slurm服务。使用命令行工具或者slurm提供的脚本,启动slurm控制守护进程(scontrol daemon),它负责集群的管理和作业调度。 4. 现在,你可以开始使用slurm来提交作业了。使用sbatch命令来提交一个作业脚本,该脚本描述了你要运行的作业的详细信息,如任务数、CPU核心数、内存需求等。提交作业后,slurm会根据你的配置和集群的资源情况来调度作业。 5. 你可以使用squeue命令来查看当前正在运行和等待运行的作业列表。使用scontrol命令可以查看更多有关作业和集群的信息,如作业状态、节点状态等。 6. 当你的作业完成后,slurm会将结果输出到指定的文件中。你可以使用sacct命令来查询作业的运行情况和结果。 总结起来,使用slurm的基本步骤包括安装slurm、配置slurm、启动slurm服务、提交作业、监视作业状态和结果。这些步骤可以帮助你充分利用slurm来管理和调度你的集群作业。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [集群Slurm使用教程](https://blog.csdn.net/pengru120/article/details/120868403)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [slurm安装指南](https://download.csdn.net/download/yttjupiter/4300960)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [slurm 使用教程](https://blog.csdn.net/funnyPython/article/details/114315004)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值