自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 资源 (4)
  • 问答 (1)
  • 收藏
  • 关注

原创 带管理口的mellanox交换机开启端口一分二特性

HPC技术指令说明书 指令编号 LCKF_HPC_20200428 指令名称 HDR交换机(MQM8700)接口模式变更. 影响范围: HDR交换机+HDR 2x100Gb/s线缆+ HDR100 HCA卡的IB网络环境, 包含MQM8700-HS2F和MQM8700-HS2R两个型号的可管理IB交换机 故障现象: HDR交换机+HDR 2x100Gb/s线缆+ HDR...

2021-11-03 11:53:22 2501 1

原创 不带管理口的mellanox交换机打开端口一分二特性

2. 这个只能看到交换机设备,但是看不到交换机的SN号,可以用flint命令获取交换机的SN号3. 获取到交换机的SN号后,在对照交换机上的保修卡就知道了交换机的对照关系,接下来开启端口一分二特性...

2021-11-03 11:47:31 1045 1

原创 常用链接地址

1. dstat 地址①:点击打开链接 地址②:点击打开链接 2. debian下载地址:http://cdimage.debian.org/cdimage/archive/3. rhel下载地址:http://www.linuxfly.org/post/659/4/1/4. windows和linux下载地址:http://www.getiso.cn/5. ...

2020-04-21 13:54:26 2046

原创 DELL服务器iDRAC IP地址能ping通,但执行ipmitool没有响应

DELL R630 使用ipmitool命令进行操作,发现没响应(IP地址可以ping通,web界面也可以登录),最后发现是因为ipmi over lan没有开通导致的,开通命令如下racadm set iDRAC.IPMILan.Enable Enabled查看IPMI Over Lan 是否成功开通racadm get iDRAC.IPMILan.Enable开通后再执行ipm...

2019-10-05 20:08:27 4489

原创 centos7 LSI-MSM安装步骤

一: 17.05.00.02_Linux-64_MSM.gz(LSI阵列卡界面管理工具)安装步骤1. yum install net-snmp-libs net-snmp-utils net-snmp libstdc++.i686 确保/usr/lib/libstdc++.so.5或/usr/lib/libstdc++.so.6存在,如果不存在就链接一个2. tar xf 17.05....

2019-09-16 10:51:24 2688

原创 centos7 drbd9源码安装

一: drbd-utils-9.10.0.tar.gz 安装步骤1. yum -y install gcc gcc-c++ libstdc++-devel make automake autoconf kernel-devel kernel-headers flex libxslt libxslt-devel asciidoc po4a2. ./configure --prefix=/usr...

2019-09-16 10:45:21 1611

原创 centos7开启VNC+XDMCP

1.首先开启xdmcp[root@localhost ~]# cat /etc/gdm/custom.conf[xdmcp]Enable=true[chooser][security]DisallowTCP=trueAllowRemoteRoot=true[debug][root@localhost ~]#2.开启vnc[root@localhost ~]# ...

2019-07-19 14:36:51 1598

原创 wget下载整个根目录

wget -c -r -np -nH -k -L -p -e robots=off 要下载的目录完整URL

2019-04-03 09:38:49 1716

转载 运维实战案例之“Too many open files”错误与解决方法

一、问题现象这是一个基于Java的Web应用系统,在后台添加数据时提示无法添加,于是登录服务器查看tomcat日志,发现了如下异常信息:java.io.IOException: Too many open files通过这个错误,基本判断是系统可用的文件描述符不够了,由于tomcat服务是系统www用户启动的,于是用www用户登录系统,通过“ulimit -n”命令查看系统

2017-11-29 10:20:45 1920

原创 openmpi跨节点报错tcp_peer_send_blocking: send() to socket 9 failed: Broken pipe (32)

客户反应作业无法跨节点,运行测试命令如下mpirun -np 8 -hostfile hostfilt.txt sleep 5运行后报错如下:[test02:01719] [[24772,0],1] tcp_peer_send_blocking: send() to socket 9 failed: Broken pipe (32)--------------------------

2017-07-21 16:24:23 2740

原创 SSH普通用户HostbasedAuthentication配置

一: 环境如下1. 系统及ssh版本如下test1:~ # cat /etc/os-release NAME="SLES"VERSION="12-SP1"VERSION_ID="12.1"PRETTY_NAME="SUSE Linux Enterprise Server 12 SP1"ID="sles"ANSI_COLOR="0;32"CPE_NAME="cpe:/o:sus

2017-07-21 10:11:55 3908

转载 Run the MPI PingPong benchmark

We will use the MPI PingPong benchmark for our testing. By default, openmpi should use inifiniband networks in preference to any tcp networks it finds. However, we will force mpi to ignore tcp network

2017-04-03 12:25:09 1443

转载 OpenMPI, LSF, InfiniBand, Mellanox OFED and Intel MPI Benchmark: what is going on ?

I usually use the Intel MPI Benchmark  (IMB) as a quick test to check everything is ok from a network point of view (connectivity and performance) My test  cluster for today: OpenMPI

2017-04-02 22:28:34 3619

转载 shell字符串处理

一: 求字符串长度格式如下:1. ${#string}2. expr length $string二: 字符串索引格式如下expr index $string $substring注:expr索引命令的功能是在字符串$string上匹配$substring中字符第一次出现的位置,若在$string上匹配不到$substring中的任何字符,expr index返

2017-01-12 11:22:22 1473

原创 华为机器IPMI、BIOS设置项和步骤

一:通过ipmcset设置项如下1.     首先把网线插到IPMI专用网口,然后通过ssh(putty)连接对应计算节点的IPMI的IP地址,其中(用户名为:root,密码为Huawei12#$)2.     绑定IPMI到第一个以太网口上,运行如下命令         ipmcset -d activeport -v 1 1 3.    把网线更换到第一个以太网口(eth0)上

2017-01-04 14:13:15 24769

原创 搭建pip本地源

环境: 系统ubuntu14.04.5             eth0: 192.168.10.18   可访问外网              eth1: 172.16.1.1          不可访问外网一:搭建pip本地源1.首先使用pip下载所有需要的python包到指定的目录内,比如/python-packagesroot@ubuntu:~# mkdir /

2016-12-22 14:33:51 9360

原创 跨节点走IB网络任务报错

1.  故障现象,客户HPC任务,走千兆网路正常运算,但是走IB网络报以下错误 psolid.x           00000000005F55AB  mpp_init_                  68  mpp_init.Fpsolid.x           0000000000519C2D  xmp_init_                  91  xmp_init

2016-11-30 10:50:04 2624

原创 恢复SMC管理节点并添加节点

一:第一次启动时把系统恢复到硬盘,用系统盘修复完毕,第一次启动时,进入单用户模式,删除/etc/udev/rules.d/70-persisten-net.rules后,重启系统 二:进入系统后设置1.首先修改hosts文件,把之前的主机信息删除,并把需要新管理的机器(IP和主机名对)添加进去2.修改/etc/conman.conf文件,删除之前的主机信息,并添加新主机信息

2016-09-20 10:36:54 705

原创 rhel实现rsh无密码访问

一:环境1.两台rhel 6.4, 主机名分别为node1和node22.ip地址分别为192.168.78.14 192.168.78.153.两台主机hosts文件都为:192.168.78.14 node1192.168.78.15 node2二:安装rsh和rsh-server(两台主机都安装),并设置启动rsh和rlogin服务1.[root@node1 ~]

2016-05-18 13:23:41 716

原创 linux限制用户本地或ssh远程登录

一:限制本地登录1. 限制普通用户本地登录把auth required pam_succeed_if.so user  = root quiet放到/etc/pam.d/login文件的第一行即可2.限制root用户本地登录,只需要把 user = root 改成 user != root 即可二:限制普通用户ssh远程登录1.编辑/etc/pam.d/sshd文件,修

2016-05-05 12:06:25 8427

转载 maui 限制使用节点数

转载自:点击打开链接想限制每个用户使用的节点数,但这一问题的解决颇费了一番周折:1. 最初想到直接从 pbs_server 层面上改,直接修改 qmgr -c 'set queue qxx max_user_run=5' 可以设置队列 qxx 中每个用户最多同时运行 5 个任务。这个修改不用重启 pbs_server 服务直接生效。但问题是,这个只是限制任务数而非节点数,如果一

2016-04-29 16:28:20 4527

原创 python实现小旋转亮片

#!/usr/bin/env pythonimport loggingimport subprocessimport osimport sysimport timeLOG_DIR = '/var/log/test/'LOG_FILE = os.path.join(LOG_DIR, 'test.log')def _mkdir_p(path):    t

2016-04-15 16:05:49 575

原创 无人职守安装sles11

安装服务器环境:1.sles 11 sp2 gnome桌面环境2.只有一个网卡eth0,IP为172.16.1.1已配置好3.确认防火墙已关闭 ◆. 配置dhcp1.yast2 dhcp-server,根据提示安装和配置dhcp服务即可(过程略)2.修改dhcp配置文件,在全局配置部分添加如下两句(红色字体)default-lease

2016-02-23 13:45:33 979

原创 未备份etc下ssh目录之设置节点间无密码访问步骤

一:root用户操作步骤1.首先备份管理节点/root/.ssh目录(以防不测)admin:~ # tar czvf root-.ssh.tar.gz .ssh/ 2.编辑/root/.ssh目录下的known_hosts文件admin:~ # vi .ssh/known_hosts 3.删除所有有关重刷节点的公钥文件,比如cin

2016-02-23 13:38:09 682

原创 SMC计算节点重刷系统步骤

一:适用环境1.比如计算节点为n001-n008(此为主机名)2.因为n006系统硬盘故障,现在需要更换n006的系统盘,或者其他原因,虽然不更换系统盘,但是需要重刷系统 二:操作步骤如下1.在更换或重刷之前需要先备份n006节点/root下的.ssh目录和/etc下的ssh目录2.关闭n006节点,更换新系统盘3.在SMC内重新刷(部署)n

2016-02-23 13:36:51 859

原创 SMC管理节点升级步骤

一:测试环境:操作系统:SLES 11 SP1 X86_64SMC版本为:1.4.0 二:操作步骤如下1.首先把待升级管理节点上的SMC license、所有计算节点管理网卡的mac地址、hosts文件、conman配置文件备份出来◆license位置在/etc/lk目录下,名为keys.dat的文件2.用dd

2016-02-23 13:35:04 1026

原创 mellanox官方驱动安装步骤

实验环境:操作系统:SLES11 SP1 X86_64 一:首先根据系统发行版本下载对应的驱动,下载地址如下:http://www.mellanox.com/page/products_dyn?product_family=26&mtag=linux_sw_drivers本次下载的驱动版本为:MLNX_OFED_LINUX-1.5.3-4.0.42-sles

2016-02-23 13:32:27 32972 2

原创 xfsdump备份测试

xfsdump支持备份方式为:0                     完全备份1 本次实验操作系统平台为SLES 11 SP1 X86_64一:备份 1.首先添加一块硬盘/dev/sdb,格式化为xfs文件系统linux-qaac:~ # mkfs.xfs /dev/sdb 2.建立了一个名为test的

2016-02-23 13:26:08 1908

原创 linux并行集群的搭建

实验环境OS:centos 5.10 x86_64(一台admin,两台计算节点)主机名和和IP对应关系如下admin: 192.168.78.11node1:192.168.78.12node2:192.168.78.13软件版本:PBStorque-3.0.6.tar.gzmaui-3.3.1.tar.gz

2016-02-23 13:21:03 3339

原创 linux根分区满了怎么办?

一:如果linux根分区使用量达到100%,会造成如下现象:root不能登录系统不能正常启动二:通过命令查找根分区内的大文件1.du -sh /* 2>/dev/null | sort -hr | head -32.如果上述命令执行后发现/var/占空间最大,那么在查找/var分区内的大文件,如:du -sh /var/* 2>/de

2016-02-22 16:43:26 10178

转载 crontab任务运行报错:Crontab FailureEmails - /bin/sh: 1 : ambiguous redirect

Crontab FailureEmails - /bin/sh: 1 : ambiguous redirectPosted on Saturday,August 4, 2012Crontab Failure EmailsThe emails vary in subject line but include:/bin/sh: 1 : ambiguous red

2016-02-22 16:25:24 4345

原创 IRIX用户管理

一:实验环境1.操作系统IRIX642.系统版本为6.5.22m 二:添加用户user步骤如下1.添加用户user# passmgmt -a -s /bin/csh user             //IRIX下添加用户命令为passmgmt2.创建用户家目录# mkdir /usr/people/user3.创建配置文件

2016-02-22 16:09:48 458 1

转载 Tkinter 鼠标键盘事件

一: 鼠标事件<Button-1> 鼠标左键单击<Button-2> 鼠标中键单击<B...

2016-01-20 21:22:11 12807 3

原创 PBS pro 有资源但作业排队的问题处理

一:有资源而且pbs_server, pbs_sched, pbs_mom服务运行正常,但是作业状态为任然为Q ?1.首先查看pbs_server的日志,发现如下信息# cd /var/spool/PBS/server_logs# cat 201512142.查看pbs_sched的日志,日志信息如下# cd /var/spool/PBS/sched_logs# c

2015-12-14 11:24:26 6570

原创 torque 安装排错

一:在管理节点发现某个节点状态为down,这种情况有两种原因第一种原因:pbs_mom 配置文件错误1.分析:服务pbs_mom启动后,默认首先去查看/var/spool/torque/mom_priv目录下是否有config文件,如果有则根据该文件下指出的pbsserver的主机名去联系管理节点(以该文件为准),如果没有该文件,则根据/var/spool/torque/serve

2015-12-03 09:12:29 2360

原创 基于windows xp并行集群的搭建

本次实验环境示意图如下图所示其中DC和DHCP已安装配置完毕一:DC端设置创建组织单位IT,并在IT内创建用户Bob(略)2.重定向计算机默认容器在CMD命令提示符下输入:redircmp OU=IT,DC=wjcyf,DC=com3.在域控制器 D盘下新建两个文件夹SoftWare和mpi,并设置共享

2015-11-30 16:11:04 1216

转载 Torque(2.4.6)+maui(3.3.1)下对用户配置节点的办法

原创作者:zhangguangping转载自:点击打开链接最近配置集群的时候,遇到了一个问题:我们的集群组分比较复杂,想对不同的用户对不同的节点有不同的使用权。所以需要将节点对用户分配。这个问题困扰了几天。几天来,看手册,上网搜资料,将所有能找到的办法都试了,还是不理想。并且发现Torque和maui的讨论区以及小木虫论坛上都有人问过这个问题。下面我把我的解决办法分享给大家,希

2014-11-26 14:02:39 2121

原创 rhel6.5安装OpenFOAM-2.3.0

OpenFOAM是一个跟Fluent,CFX类似的CFD软件,但其为开源的,可以看做是一个在linux下运行的计算流体动力学(CFD)类库,OpenFOAM的前身为FOAM(Field Operation and Manipulation的简写),后来作为开源代码公布到网上,任何人都可以自由下载和传播它的源代码。其作者之一Hrvoje Jasak为克罗地亚人,1993年在读PhD期间开始写FO

2014-10-23 10:20:28 3123

原创 sles11之nis服务器配置

今天在测试过程中发现,SLES下NIS服务配置和RHEL有所不同,如果按照RHEL方法配置,特别是NIS客户端配置(通过脚本快速配置)是不行的,实验了好多遍,终于测试成功,以下为测试过程 实验环境:1.OS:四台SLES11SP2 x86_64(最小化安装)2.IP和主机名对应关系:  admin 192.168.78.11  client1 192.168.78.12

2014-09-30 00:07:23 2203

原创 sgi集群管理软件SMC安装步骤整理

一:系统和硬件要求1.SGI Management Center Serversles 11 sp1 、sp2、sp3                {x86_64}rhel 6.0-6.4   centos 6.0-6.42. SGI Management Center Payload Installationsles 11 sp1 或sp2                {

2014-09-24 17:10:13 2874

SuSE Linux Enterprise Server 10 SP4-x86_64下载

SuSE Linux Enterprise Server 10 SP4-x86_64 百度云下载地址

2017-04-10

SuSE Linux Enterprise Server 12 SP2-x86_64

SuSE Linux Enterprise Server 12 SP2-x86_64 百度云下载地址

2017-04-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除