工作笔记
wjcaiyf
这个作者很懒,什么都没留下…
展开
-
带管理口的mellanox交换机开启端口一分二特性
HPC技术指令说明书 指令编号 LCKF_HPC_20200428 指令名称 HDR交换机(MQM8700)接口模式变更. 影响范围: HDR交换机+HDR 2x100Gb/s线缆+ HDR100 HCA卡的IB网络环境, 包含MQM8700-HS2F和MQM8700-HS2R两个型号的可管理IB交换机 故障现象: HDR交换机+HDR 2x100Gb/s线缆+ HDR...原创 2021-11-03 11:53:22 · 3129 阅读 · 1 评论 -
不带管理口的mellanox交换机打开端口一分二特性
2. 这个只能看到交换机设备,但是看不到交换机的SN号,可以用flint命令获取交换机的SN号3. 获取到交换机的SN号后,在对照交换机上的保修卡就知道了交换机的对照关系,接下来开启端口一分二特性...原创 2021-11-03 11:47:31 · 1235 阅读 · 1 评论 -
wget下载整个根目录
wget -c -r -np -nH -k -L -p -e robots=off 要下载的目录完整URL原创 2019-04-03 09:38:49 · 1740 阅读 · 0 评论 -
centos7开启VNC+XDMCP
1.首先开启xdmcp[root@localhost ~]# cat /etc/gdm/custom.conf[xdmcp]Enable=true[chooser][security]DisallowTCP=trueAllowRemoteRoot=true[debug][root@localhost ~]#2.开启vnc[root@localhost ~]# ...原创 2019-07-19 14:36:51 · 1665 阅读 · 0 评论 -
centos7 drbd9源码安装
一: drbd-utils-9.10.0.tar.gz 安装步骤1. yum -y install gcc gcc-c++ libstdc++-devel make automake autoconf kernel-devel kernel-headers flex libxslt libxslt-devel asciidoc po4a2. ./configure --prefix=/usr...原创 2019-09-16 10:45:21 · 1714 阅读 · 0 评论 -
centos7 LSI-MSM安装步骤
一: 17.05.00.02_Linux-64_MSM.gz(LSI阵列卡界面管理工具)安装步骤1. yum install net-snmp-libs net-snmp-utils net-snmp libstdc++.i686 确保/usr/lib/libstdc++.so.5或/usr/lib/libstdc++.so.6存在,如果不存在就链接一个2. tar xf 17.05....原创 2019-09-16 10:51:24 · 2827 阅读 · 0 评论 -
DELL服务器iDRAC IP地址能ping通,但执行ipmitool没有响应
DELL R630 使用ipmitool命令进行操作,发现没响应(IP地址可以ping通,web界面也可以登录),最后发现是因为ipmi over lan没有开通导致的,开通命令如下racadm set iDRAC.IPMILan.Enable Enabled查看IPMI Over Lan 是否成功开通racadm get iDRAC.IPMILan.Enable开通后再执行ipm...原创 2019-10-05 20:08:27 · 4691 阅读 · 0 评论 -
SSH普通用户HostbasedAuthentication配置
一: 环境如下1. 系统及ssh版本如下test1:~ # cat /etc/os-release NAME="SLES"VERSION="12-SP1"VERSION_ID="12.1"PRETTY_NAME="SUSE Linux Enterprise Server 12 SP1"ID="sles"ANSI_COLOR="0;32"CPE_NAME="cpe:/o:sus原创 2017-07-21 10:11:55 · 3993 阅读 · 0 评论 -
openmpi跨节点报错tcp_peer_send_blocking: send() to socket 9 failed: Broken pipe (32)
客户反应作业无法跨节点,运行测试命令如下mpirun -np 8 -hostfile hostfilt.txt sleep 5运行后报错如下:[test02:01719] [[24772,0],1] tcp_peer_send_blocking: send() to socket 9 failed: Broken pipe (32)--------------------------原创 2017-07-21 16:24:23 · 2779 阅读 · 0 评论 -
crontab任务运行报错:Crontab FailureEmails - /bin/sh: 1 : ambiguous redirect
Crontab FailureEmails - /bin/sh: 1 : ambiguous redirectPosted on Saturday,August 4, 2012Crontab Failure EmailsThe emails vary in subject line but include:/bin/sh: 1 : ambiguous red转载 2016-02-22 16:25:24 · 4410 阅读 · 0 评论 -
linux根分区满了怎么办?
一:如果linux根分区使用量达到100%,会造成如下现象:root不能登录系统不能正常启动二:通过命令查找根分区内的大文件1.du -sh /* 2>/dev/null | sort -hr | head -32.如果上述命令执行后发现/var/占空间最大,那么在查找/var分区内的大文件,如:du -sh /var/* 2>/de原创 2016-02-22 16:43:26 · 10414 阅读 · 0 评论 -
mellanox官方驱动安装步骤
实验环境:操作系统:SLES11 SP1 X86_64 一:首先根据系统发行版本下载对应的驱动,下载地址如下:http://www.mellanox.com/page/products_dyn?product_family=26&mtag=linux_sw_drivers本次下载的驱动版本为:MLNX_OFED_LINUX-1.5.3-4.0.42-sles原创 2016-02-23 13:32:27 · 33452 阅读 · 2 评论 -
SMC管理节点升级步骤
一:测试环境:操作系统:SLES 11 SP1 X86_64SMC版本为:1.4.0 二:操作步骤如下1.首先把待升级管理节点上的SMC license、所有计算节点管理网卡的mac地址、hosts文件、conman配置文件备份出来◆license位置在/etc/lk目录下,名为keys.dat的文件2.用dd原创 2016-02-23 13:35:04 · 1070 阅读 · 0 评论 -
SMC计算节点重刷系统步骤
一:适用环境1.比如计算节点为n001-n008(此为主机名)2.因为n006系统硬盘故障,现在需要更换n006的系统盘,或者其他原因,虽然不更换系统盘,但是需要重刷系统 二:操作步骤如下1.在更换或重刷之前需要先备份n006节点/root下的.ssh目录和/etc下的ssh目录2.关闭n006节点,更换新系统盘3.在SMC内重新刷(部署)n原创 2016-02-23 13:36:51 · 876 阅读 · 0 评论 -
未备份etc下ssh目录之设置节点间无密码访问步骤
一:root用户操作步骤1.首先备份管理节点/root/.ssh目录(以防不测)admin:~ # tar czvf root-.ssh.tar.gz .ssh/ 2.编辑/root/.ssh目录下的known_hosts文件admin:~ # vi .ssh/known_hosts 3.删除所有有关重刷节点的公钥文件,比如cin原创 2016-02-23 13:38:09 · 695 阅读 · 0 评论 -
恢复SMC管理节点并添加节点
一:第一次启动时把系统恢复到硬盘,用系统盘修复完毕,第一次启动时,进入单用户模式,删除/etc/udev/rules.d/70-persisten-net.rules后,重启系统 二:进入系统后设置1.首先修改hosts文件,把之前的主机信息删除,并把需要新管理的机器(IP和主机名对)添加进去2.修改/etc/conman.conf文件,删除之前的主机信息,并添加新主机信息原创 2016-09-20 10:36:54 · 728 阅读 · 0 评论 -
跨节点走IB网络任务报错
1. 故障现象,客户HPC任务,走千兆网路正常运算,但是走IB网络报以下错误 psolid.x 00000000005F55AB mpp_init_ 68 mpp_init.Fpsolid.x 0000000000519C2D xmp_init_ 91 xmp_init原创 2016-11-30 10:50:04 · 2760 阅读 · 0 评论 -
华为机器IPMI、BIOS设置项和步骤
一:通过ipmcset设置项如下1. 首先把网线插到IPMI专用网口,然后通过ssh(putty)连接对应计算节点的IPMI的IP地址,其中(用户名为:root,密码为Huawei12#$)2. 绑定IPMI到第一个以太网口上,运行如下命令 ipmcset -d activeport -v 1 1 3. 把网线更换到第一个以太网口(eth0)上原创 2017-01-04 14:13:15 · 25155 阅读 · 0 评论 -
PBS pro 有资源但作业排队的问题处理
一:有资源而且pbs_server, pbs_sched, pbs_mom服务运行正常,但是作业状态为任然为Q ?1.首先查看pbs_server的日志,发现如下信息# cd /var/spool/PBS/server_logs# cat 201512142.查看pbs_sched的日志,日志信息如下# cd /var/spool/PBS/sched_logs# c原创 2015-12-14 11:24:26 · 6756 阅读 · 0 评论