IBM Spectrum LSF 安全性及高级配置

IBM Spectrum LSF 安全性
了解如何优化 LSF 集群的安全性。

  • LSF 安全注意事项
    虽然缺省 LSF 配置适用于大多数集群,但如果要提高 LSF 集群的安全性,那么应考虑以下问题。

  • 保护 LSF 集群
    执行以下任务以保护 LSF 集群。

IBM Spectrum LSF 高级配置
了解 LSF 错误和事件日志记录以及 LSF 如何处理作业异常。 配置高级 LSF 功能部件。

  • 错误和事件日志记录
    了解 LSF 如何使用系统目录,日志文件,临时工作文件,日志文件以及事务文件和作业假脱机文件。 管理 LSF 错误日志,系统事件日志。 配置事件日志的重复日志记录并设置守护程序消息日志级别。 设置守护程序计时级别并配置 LSF 作业终止原因日志记录。 了解 LSF 作业退出代码。

  • 事件生成
    了解 LSF 如何检测守护程序操作期间发生的事件。 LSF 提供了一个将 LSF 事件转换为 SNMP 陷阱的程序。 某些守护程序操作会导致 mbatchd 或 父 LIM 调用事件程序以生成事件。 每个 LSF 事件都由一个预定义数字标识,该数字作为自变量传递到事件程序。

  • 定制批处理命令消息

  • LIM 如何确定主机型号和类型

  • 共享文件访问

  • 共享配置文件内容
    使用 #INCLUDE 伪指令将指定文件的内容插入到配置文件中,以在集群或主机之间共享公共配置。

  • 认证和授权

  • 处理作业异常

  • 调整 CPU 因子

  • 设置 DONE 作业的清除周期

  • 启用基于主机的资源
    了解如何将可移植硬件位置 (hwloc) 集成到 LSF 中以检测硬件信息。 启用 LSF ,以便应用程序可以在 Linux 环境中使用 NVIDIA 图形处理单元 (GPU) 和 Intel Xeon Phi (MIC) 辅助处理器。

  • 全局公平共享调度
    全局公平共享调度策略在用户之间划分 IBM Spectrum LSF 多集群功能 和 IBM Spectrum LSF Advanced Edition 的 LSF/XL 功能部件 的处理能力,以提供对所有资源的公平访问权,以便每个用户都可以根据其配置的共享来使用多个集群的资源。

  • 在 EGO 上管理 LSF
    企业网格编排器 功能 (EGO) 使企业应用程序能够从跨企业网格共享资源中获益。 配置 LSF on EGO 时, EGO 充当 LSF的中央资源代理程序。

  • 装入共享 X 应用程序

  • 将 LSF 与 Etnus 配合使用 TotalView 调试器

  • 向 LSF 服务器注册 LSF 主机名和 IP 地址
    向 LSF 服务器注册本地 LSF 主机的 IP 地址和主机名,以便 LSF 服务器不需要使用 DNS 服务器来解析本地主机。

IBM Spectrum LSF 性能调整
调整 LSF 集群的性能和可伸缩性。

  • 调整 IBM Spectrum LSF 集群
    调整 LIM 策略和参数以提高性能。 使用 badmin mbdrestart -p 启用并行重新启动以在 mbatchd 重新启动后缩短 mbatchd 响应时间。 在支持线程编程的 UNIX 平台上,更改缺省 mbatchd 行为以使用多线程并提高 bjobs 查询请求的性能。 配置硬 CPU 亲缘关系以指定可运行 mbatchd 子查询进程的 管理 主机 CPU。 使用 lsb.params 中的 JOB_SWITCH2_EVENT 参数来记录 mbatchd 性能指标。 启用 DISPATCH_BY_QUEUE 以提高队列响应能力。

  • 实现性能和可伸缩性
    针对大型集群调整 LSF ,并实时监视性能指标。 通过调整查询,调度和事件日志记录来优化大型站点中的性能。

IBM Spectrum LSF 能源感知调度
针对大型 LSF 安装配置,管理和使用 IBM Spectrum LSF 能源感知调度功能,其中操作大型系统的能源需求正在成为这些系统总体成本的重要因素。

LSF 为大型 LSF 安装提供了能源感知调度功能,其中操作大型系统的能源需求正在成为这些系统总体成本的一个重要因素。 在具有完整生产的长周期或波动较大的工作负载的大型系统上,许多节点可以在相当长的时间段内处于空闲状态。 LSF 的能量感知调度功能使管理员能够控制处理器频率,以允许某些应用程序以降低的频率运行,从而降低性能。 降低频率可导致总体省电。 相反,将未使用的核心上的频率降至最低还可以启用对活动核心的最大提升,以提高应用程序性能并减少运行时间。 频率控制允许组织平衡性能与节能。 应该注意的是,对于可调整大小的作业, bjobs 只能获取最新可调整大小的作业的执行主机的能源成本。

LSF 能源感知调度包含以下功能:

-基于主机的策略,用于管理主机的电源状态。
-能够在作业,应用程序或队列级别设置 CPU 频率。
-收集和报告应用程序的电源使用情况 (假定独占使用节点)。
-对应用功率使用和相关功率系数的生成进行基准测试。
-在不同 CPU 频率下预测应用程序的性能,功耗和运行时。
-根据预测自动选择作业的 CPU 频率。

  • 管理主机电源状态
    LSF 能源感知调度主机电源状态管理对 LSF 集群中的主机启用自动工作负载驱动电源管理策略。 LSF 可以根据作业需要打开主机的电源,并随着工作负载的变化采取相应的电源管理操作。 电源管理策略支持 xCAT V 2.7的电源管理功能。

  • CPU 频率管理
    要启用 CPU 频率管理,请在 lsf.conf. 中设置 LSF_MANAGE_FREQUENCY 。缺省情况下,未启用 CPU 频率管理 (LSF_MANAGE_FREQUENCY=N)。 如果 LSF_MANAGE_FREQUENCY=N,那么将禁用 CPU 频率管理,并且 lim 将不会装入 elim.frequency。

  • 自动 CPU 频率选择
    自动 CPU 频率选择允许组织平衡性能与省电。

IBM Spectrum LSF 多集群功能
了解如何使用和管理 IBM Spectrum LSF 多集群功能 以在 LSF 集群之间共享资源。

  • LSF 多集群功能概述
    了解多个 LSF 集群如何解决与不同地理位置的易于管理,可伸缩性和站点相关的问题。 使用 LSF 多集群功能,通过资源租赁或作业转发在集群之间共享资源。

  • 设置 IBM Spectrum LSF 多集群功能
    设置 IBM Spectrum LSF 多集群功能,请参阅系统需求和安装后配置过程。 了解如何确保守护程序通信的安全性并配置集群之间的认证。

  • IBM Spectrum LSF 多集群功能作业转发模型
    在作业转发模型中,资源短缺的集群会将作业发送到具有备用资源的集群。

  • IBM Spectrum LSF 多集群功能资源租赁模型
    在资源租赁模型中,两个集群同意一个集群将从另一个集群借用资源,以控制另一个集群的资源。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值