IDC服务器运维常见命令

本文详细介绍了服务器管理中的硬盘操作,包括查看硬盘状态、处理只读分区、重建RAID。同时,讲解了网络配置与故障排查,如重启网络服务、查看网卡状态、处理boding异常。此外,还涉及到了BMC的用户管理和日志监控,以及带外管理中的常见问题与解决方法。最后,提到了CPU、内存和显卡的相关信息查询工具,如dmidecode和nvidia-smi。
摘要由CSDN通过智能技术生成

1、硬盘

lsblk  #查看硬盘
./smartctl -a /dev/sd*/  #HDD盘
./nvme smart-log /dev/nvme*n*  #Nvme盘
fdisk -l | grep /dev/sd*  #系统下查看硬盘是否识别
./sas3ircu 0 DISPLAY | grep -i ser  #查看硬盘sn
mount -a  #根据/etc/fstab挂载所有设备
./MegaCli64 -AdpBbuCmd -GetBbuStatus -A0  #查询阵列卡电池状态

1.1、案例:Data分区只读

R #系统选项处按R
rw init=/bin/bash #Ctrl+X进入单用户模式
vi /etc/fstab #注释错误分区
exec /sbin/init #重进os

1.2、案例:重做RAID

bios boot-legacy(传统模式)
开机界面ctrl+R
F2:Clear raid-重做Raid

1.3、案例:手动DD

dd if=/dev/zero of=/dev/sdb bs=512K count=1   #手动dd

2、网卡

2.1、常用命令

service network restart #重启网络服务
ip add sh  #查看所有网卡状态
route -n  #查看路由表

ifconfig  #查看up网卡状态、顺序
         eht* up  #up网口
         eht* down  #down网口 


netstat -i #接口状态
        -t #显示激活的TCP连接
        -vat #显示所有活动

ethtool bond1/eth* #查看速率
        -p eht* 10  #物理网口灯闪烁10s
        -i eht* | grep firmware  #查看固件版本
        -S eth1 | grep crc   #查看CRC报错

2.2、常用路径

/proc/net/bonding/bond  #bond配置文件
/etc/sysconfig/network-scripts/~  #网络配置文件
/etc/udev/rules.d/70-persistent-net.rules  #mac与网卡逻辑名绑定关系
/etc/hostname  #存放主机名
/etc/hosts  #本地静态DNS解析条目,优先级默认高于DNS服务器
/etc/resolv.conf  #配置指定DNS服务器

2.3、案例:boding异常

ip add sh  #查看所有网卡状态,确认 AID&speed 是否一致
cat etc/sysconfig/network-scripts  #网络配置
ifconfig

3、BMC

3.1、ipmitool user 重置带外

ipmitool user list 1 #查看用户清单
ipmitool user set name 用户ID albert #创建用户
ipmitool user set password 用户ID admin #设置密码
ipmitool channel setaccess 1 用户ID callin=on ipmi=on link=on privilege=4
ipmitool user enable <userid> #启用账户
ipmitool user  test <userid> <16|20> <password> #验证密码

3.2、ipmitool日志

ipmitool sdr elist | grep -i dimm  #sdr日志
ipmitool sel elist  #sel日志
ipmitool lan print  #打印lan口

3.3、案例:带外异常

端口是否亮
BIOS下带外是否获取到IP  #shared 共享 delicated 独立
server mgmt—bmc network configuration—dynamicdhcp:enable
cat sel日志
断电重启  #5min后重新检测
密码错误:检测设备产品序列号,现场重置用户密码
ping不可达:确认设备是否可获取带外IP
交换机端口未开启,排查交换机配置问题
排查设备是否存在硬件问题
插拔、断电重启、服务器基本设置检查都没问题,则检查带外配置

4、CPU、内存、显卡

4.1、dmidecode常用命令

dmidecode | grep Ser  #查询当前服务器SN
dmidecode | grep 'Product Name'  #查看服务器型号
dmidecode | grep 'Serial Number'  #查看主板的序列号
dmidecode | grep -A16 "Memory Device" | grep "Size" #现有内存数量和内存大小
dmidecode | grep "Maximum Capacity"  #最大支持内存容量
dmidecode -s system-serial-number   #查看系统序列号
dmidecode -t memory #查看内存信息
dmidecode -t 11  #查看OEM信息

4.2、其他

turbostat  #CPU是否降频
lscpu  #查询CPU核心数、型号
nvidia-smi  #显卡使用率
lspci | grep -i nv  #查看显卡

  • 10
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鹤染

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值