我有一个在Torque / Maui系统下运行的复杂的fortran MPI应用程序. 当我运行我的应用程序时,它将产生巨大的唯一输出(?20 GB). 为了避免这种情况qsub 投递任务指定节点,我制作了一个RunJob脚本,该脚本将运行分为5部分,每个脚本产生的输出更小且更易于处理.
当前,我的RunJob脚本在第一部分的末尾正确停止,并且还产生正确的输出. 但是,当它尝试重新启动时,会出现以下错误消息:
qsub: 作业执行错误的UID MSG = ruserok无法通过compute-0-0.local验证用户名/用户名
我知道此问题来自以下事实: Torque / Maui系统默认情况下不允许节点提交作业.
实际上,当我键入以下内容时:
qmgr -c“ l s” | grep allow_node_submit