HPC
文章平均质量分 80
高性能计算专有技术相关文章
ShawnTheLearner
这个作者很懒,什么都没留下…
展开
-
GPFS报错 “stale file handle”
Unfortunately, the GPFS service running at compute nodes “mmfsd” gets killed sometimes by the out of memory killer. This usually unmounts GPFS from the compute node and makes it unavailable in LSF. The mount point /gpfs3 shows “stale file handle”. This can原创 2022-09-01 11:51:35 · 1133 阅读 · 0 评论 -
GPFS各类排故日志收集汇总
There are many troubleshooting procedures for the GPFS available. (warning) The GPFS problem determination guide consists on several hundred pages. Some operations should only be performed together with the GPFS support.It’s always good to have a look at原创 2021-05-20 20:32:25 · 1122 阅读 · 0 评论 -
Ganglia监控工具简介及初始安装过程
Ganglia是经典的集群监控工具,常用于监控、记录高性能计算(HPC)集群的节点负载(CPU,内存,网络,IO等)。本文简要描述了Ganglia的基本信息,并根据个人实际部署笔记,记录了Ganglia初始安装过程。原创 2020-06-11 11:08:51 · 514 阅读 · 0 评论 -
IBM Spectrum LSF 9.1.3 基本概念简介
个人学习笔记,仅供参考,如若描述有误欢迎讨论指正!1. LSF HostsHosts in your cluster perform different functions.Master hostLSF server host that acts as the overall coordinator for the cluster, doing all job scheduling and dispatch.Server hostA host that submits and runs jobs原创 2020-06-09 13:39:04 · 1581 阅读 · 0 评论 -
xCAT初始安装笔记
快速记录下自己在虚拟机安装xCAT的过程,仅供参考。1. 下载、安装xCAT安装包,包括 core & dephttp://xcat.org/download.html,当前最新版本2.13.8,core和dep版本一致。xcat-core-2.13.8-linux.tar.bz2xcat-dep-2.13.8-linux.tar.bz22. 创建安装路径并解压mkdir -p ~/xcatcd ~/xcat/mv ../xcat* ./tar jxvf xcat-core-2.1原创 2020-06-01 16:49:52 · 955 阅读 · 0 评论 -
Mellanox Infiniband 架构设计快速实战指南 - B
书接上回:Mellanox Infiniband 架构设计快速实战指南 - A2. Infiniband协议类型在 Mellanox Infiniband Topology Generator 中,选定了网络拓扑后,接下来很重要的就是选定Infiniband的Data Rate,或者可以称为Infiniband协议类型。在Wikipedia中,Infiniband历史上全部的类型包括SDR: 2001/2003年DDR: 2005年QDR: 2007年FDR: 2011年EDR: 2014年原创 2020-05-21 16:36:28 · 4081 阅读 · 1 评论 -
Mellanox Infiniband 架构设计快速实战指南 - A
Nvidia GTC 2020正在进行中,Nvidia(英伟达)最终完成了对以色列高速计算网络厂商Mellanox的收购,再一次被黄老板高度评价。Mellanox Infiniband至今依然是高速计算互联网络的主流厂商和解决方案,在HPC领域应用广泛。本文基于Mellanox官方提供的材料,介绍如何快速上手Infiniband高速互联网络的设计规划。原创 2020-05-20 14:08:26 · 5478 阅读 · 3 评论