服务器硬盘检测系统,服务器RAID硬盘与日志主要检测方法

服务器RAID硬盘与日志主要检测方法

1:对于Dell的机器并且配备了LSI的raid卡,那么Megacli自带的命令是最直观最可靠的硬盘检测方法。

#/opt/MegaRAID/MegaCli/MegaCli64-pdlist-aall

以其中的一块硬盘为例。

Enclosure Device ID: 32

Slot Number: 2

Enclosure position: 0

Device Id: 2 //ID号

Sequence Number: 2

Media Error Count: 0 //如果error数值较多,那么需要更换硬盘

Other Error Count: 0

Predictive Failure Count: 0 //可理解为预知性的错误,这个数值较多意味着硬盘即将坏掉,现场会黄绿灯交叉闪烁

Last Predictive Failure Event Seq Number: 0

PD Type: SAS

Raw Size: 136.732 GB [0x Sectors]

Non Coerced Size: 136.232 GB [0x Sectors]

Coerced Size: 136.125 GB [0x Sectors]

Firmware state: Online, Spun Up //如 果 硬 盘 坏 了 那 么 会 出 现Failed或 者 是

unconfigured(bad)SAS Address(0): 0xe11716a112

SASAddress(1): 0x0

Connected Port Number: 0(path0)

Inquiry Data: FUJITSU MBD2147RC D809D0A4PB103ALA

FDE Capable: Not Capable

FDE Enable: Disable

Secured: Unsecured

Locked: Unlocked

Needs EKM Attention: No

Foreign State: None

Device Speed: 6.0Gb/s

Link Speed: 6.0Gb/s

Media Type: Hard DiskDevice

Drive Temperature :28C (82.40 F)

一些对磁盘I/O操作比较密集的应用例如squid经常会有掉盘的现象, 这时有时候通过上述

命令会发现找不到其中的一块硬盘,即“消失了”,如果进入RAID卡界面会发现磁盘处于Foreign或者missing的状态,这种情况其实硬盘并没有坏掉或者说并没有完全坏掉(有诸多原因,包括RAID卡、背板、SAS线等等),如果是在线跑业务的机器不能重启,那么这时候就需要通过RAID卡的日志进行分析是否真的坏了。#/opt/MegaRAID/MegaCli/MegaCli64-fwtermlog-dsply-aall

如果是硬盘坏了那么会发现有offline或者是某块硬盘有timeout的记录,需要认真分析日志。

2,其它品牌硬盘检测方法,具体看附件。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值