原先胖节点服务器的操作系统已经全部升级到CentOS release 6.2 Linux x86_64,并整合到sugon服务器上统一调度管理,8个节点的配置略有不同,如下所示:
节点名
服务器型号
CPU
内存(GB)
node81~node83
浪潮TS850
48核Intel Xeon E7540处理器,主频2.0GHz
128
node84~node85
浪潮TS850
64核Intel Xeon E8837处理器,主频2.66GHz
256
node86~node87
曙光A950-r
48核AMD Opteron 8431处理器,主频2.4GHz
128
node88
曙光A620r-G
24核AMD Opteron 6168处理器,主频1.9GHz
32
针对此8个特殊节点服务器上特别配置了2个队列:
队列 fat48,提交到此队列上的作业可运行于node81~node85节点上。
队列 fat64,提交到此队列上的作业可运行于node86和node87节点上。 (目前实际仅运行于node87节点上,node86暂不参与调度,另有他用)
使用队列fat48、fat64,用bsub提交作业时需要另加参数-R "rusage[mem=****]",**** 为每个作业进程需要的内存数,以MB为单位。
例如提交一个8核进程数,内存总需求8GB的作业:
原提交命令: bsub -q normal -n 8 -o %J.log -e %J.err mpijob 123.job
加参数后的命令: bsub -q normal -n 8 -o %J.log -e %J.err -R "rusage[mem=1000]" mpijob 123.job
mem参数的计算方法为:申请总内存数/申请的CPU核数,即8GB约为8000MB , 8000/8=1000 , 则设定rusage[mem=1000] ,节点上必须满足-n参数、-R参数以及其他一些必要的资源才会分配队列中的作业。
使用fat48、fat64队列的用户在提交作业时,参照以上方法按照自己程序提交时设定的CPU核数以及内存数作相应换算后设定mem值再提交作业,禁止把剩余内存全部申请完,并请注意作业仅在单节点内并行计算,不可跨节点并行。
胖节点服务器资源有限,仅提供给作业运行需要较大内存的用户计算。
请预申请使用此类节点的用户单独向中心提出申请,申请邮件中要求详细介绍自己的计算体系,说明申请使用大内存的理由。
服务器整合结束,加入sugon系统统一调度管理之后,新系统配置及使用指南请见站内链接: