磁盘SMART信息详解

1,机械硬盘的SMART表定义已经有自己的标准,由于硬盘厂很多,很多厂家属性的名字也不尽相同,

或者某些厂牌缺少某些属性,但是同个ID的定义是相同的。机械硬盘的SMART属性表如下:

ID ID十六进制值 英文名 中文译名 最优 说明
10x01 read error rate底层数据读取错误率
Dark Green Arrow Down.svg
存储器从一个硬盘表面读取数据时发生的错误率。原始值由于不同厂商的不同计算方法而有所不同,其十进制值往往无意义的。一般来说有数值意味着磁头已出现问题了。
20x02 Throughput Performance读写通量性能
Dark Green Arrow Up.svg
通常是硬盘读写性能的测量值,如果其值有变动,有可能硬盘出现了问题。
30x03 Spin-Up Time盘片启动时间
Dark Green Arrow Down.svg
盘片由静止启动加速到稳定正常运行速度的平均所需时间。
40x04 Start/Stop Count电机起停次计数
Dark Green Arrow Down.svg
一个盘片启动关闭周期的统计值,只有硬盘从完全断电中启动或从睡眠模式恢复,盘片主轴电机被启动时才会记一次数。
50x05 Reallocated Sector Count重定位磁区计数
Dark Green Arrow Down.svg
记录由于损坏而被映射到无损的后备区的扇区计数。当硬盘出现损坏扇区时,可以通过将其物理空间指向到特定的无损区域进行重映射修复,从而出现坏扇区的硬盘仍可使用。但当高过一定数值后,后扇区消耗殆尽而无法再重映射修复时,这些坏扇区就会显现出来且无法自行修复。除外由于要要求磁头读取这些坏扇区时专门再移动到后备区读写数据,对硬盘读写性能也有影响。
60x06 Read Channel Margin信道读取余量 读取数据时信道可用的余量,该属性没制定任何功用。
70x07 Seek Error Rate寻道错误率 (该属性是特定制造商才有的)磁头寻找磁道由于机械问题而出错几率,有多种原因可能引致出错,如:磁头伺服构件,盘体过热,或损坏。于不同厂商的不同计算方法而有所不同,其十进制值往往无意义的。
80x08 Seek Time Performance寻道性能
Dark Green Arrow Up.svg
每次寻道时间的平均值,该值短期内迅速减少,有可能硬盘出现了问题。
90x09 Power-On Hours硬盘加电时间
Dark Green Arrow Down.svg
硬盘自出厂以来加电启动的统计时间,单位为小时(或根据制造商设定为分钟或秒),一般用户以该值判定硬盘是否被使用过。
100x0a Spin Retry Count电机起转重试
Dark Green Arrow Down.svg
S.M.A.R.T参数电机起转重试,表明了主轴电机的启动尝试次数。这个属性存储了关于主轴电机尝试加速到完全可操作速度的次数(在这种情况下,意味着主轴电机的第一次启动尝试没有成功)。主轴电机频繁的尝试启动,意味着硬盘驱动器的寿命可能将近实际限值。
110x0b Recalibration Retries磁头校准重试
Dark Green Arrow Down.svg
磁头在一次运行失败时尝试校准至正常状态的统计数,该值改变时意味着硬盘的机械部件已经出现问题了。
120x0c Power Cycle Count设备开关计数 该属性表示硬盘电源充分开/关循环计数。
130x0d Soft Read Error Rate软件读取错误率
Dark Green Arrow Down.svg
操作系统读取数据时的出错率。
1830xb7 SATA Downshift Error CountSATA降级运行计数 Western Digital 和 Samsung 特有属性,记录由于兼容问题导致降低SATA传输级别运行的计数。
1840xb8 End-to-End error终端校验出错
Dark Green Arrow Down.svg
HP专有S.M.A.R.T.(SMART IV)技术的一个特有属性,记录硬盘从盘片读取数据到高速缓存后再传输到主机时数据校验出错的次数。
1850xb9 Head Stability磁头稳定性 Western Digital特有属性
1860xba Induced Op-Vibration Detection  Western Digital特有属性
1870xbb Reported Uncorrectable Errors报告不可纠正错误
Dark Green Arrow Down.svg
硬件ECC无法恢复的错误计数。
1880xbc Command Timeout通信超时
Dark Green Arrow Down.svg
由于无法连接至硬盘而终止操作的统计数,一般为0,如果远超过0,则可能电源问题,数据线接口氧化或更严重的问题。
1890xbd High Fly Writes磁头写入高度
Dark Green Arrow Down.svg
硬盘进行写入时对磁头高度进行监控以提供额外的保障。当磁头处于不正常高度进行写入时,写入操作会被终止,原有数据重写入或者将该扇区重映射到安全区域。该属性是统计值。
1900xbe Airflow Temperature气流温度
Dark Green Arrow Down.svg
Western Digital特有属性,计量硬盘内气流温度,和检测项0xc2相似。
1910xbf G-sense Error Rate加速度错误率
Dark Green Arrow Down.svg
计量可能对硬盘做成损害的冲击次数。
1920xc0 Power-off Retract Count电源关闭磁头收回计数
Dark Green Arrow Down.svg
计量磁头在没有加电时不移进硬盘的值。
1930xc1 Load Cycle Count磁头升降计数
Dark Green Arrow Down.svg
计量磁头在加电时移进/移出硬盘周期的值。
1940xc2 Temperature温度
Dark Green Arrow Down.svg
计量硬盘的温度
1950xc3 Hardware ECC Recovered硬件ECC恢复 (特定原始值)
1960xc4 Reallocation Event Count重定位事件计数
Dark Green Arrow Down.svg
记录已重映射扇区和可能重映射扇区的事件计数。
1970xc5 Current Pending Sector Count等候重定的扇区计数
Dark Green Arrow Down.svg
记录了不稳定的扇区的数量。
1980xc6 Uncorrectable Sector Count无法校正的扇区计数
Dark Green Arrow Down.svg
记录肯定出错的扇区数量。
1990xc7 UltraDMA CRC Error CountUltraDMA通讯CRC错误
Dark Green Arrow Down.svg
记录硬盘通讯时发生的CRC错误。
2000xc8 Multi-Zone Error Rate多区域错误率
Dark Green Arrow Down.svg
写入一个区域时发现的错误的计数。
2000xc8 Write Error Rate写入错误率
Dark Green Arrow Down.svg
Fujitsu的特别属性,写入一个区域时发现的错误的计数。
2010xc9 Soft Read Error Rate逻辑读取错误率
Dark Green Arrow Down.svg
记录脱轨错误。
2020xca Data Address Mark errors数据地址标记错误
Dark Green Arrow Down.svg
记录数据地址标记错误(或制造商特定的计数)
2030xcb Run Out Cancel用完取消
Dark Green Arrow Down.svg
ECC错误计数
2040xcc Soft ECC Correction逻辑ECC纠正
Dark Green Arrow Down.svg
记录由软件ECC更正的错误计数。
2050xcd Thermal Asperity Rate热嘈率
Dark Green Arrow Down.svg
记录高温导致的出错记数。
2060xce Flying Height飞行高度 记录磁头的飞行高度。飞得太低会增加磁头撞毁的机会,飞得太高增加读写错误的机会。
2070xcf Spin High Current主轴电机浪涌电流计数
Dark Green Arrow Down.svg
记录主轴电机运转时浪涌电流的次数。
2080xd0 Spin Buzz  记录由于电力不足而启动主轴电机的蜂鸣声次数。
2090xd1 Offline Seek Performance离线寻址性能 在其内部测试硬盘的寻址能力表现。
2100xd2  (没定性,出现在Maxtor 6B200M0 200GB 和Maxtor 2R015H1 15GB 的硬盘中)
2110xd3 Vibration During Write写操作震动 记录写入操作的震动数。
2120xd4 Shock During Write写操作冲击 记录写入操作时的冲击数。
2200xdc Disk Shift盘体偏移
Dark Green Arrow Down.svg
记录盘体由于冲击或温度导致偏离主轴的相对距离。
2210xdd G-Sense Error Rate加速计出错率
Dark Green Arrow Down.svg
从外部诱发的冲击和振动产生的错误计数。
2220xde Loaded Hours数据加载时间 数据读取时所花费的时间。(磁头移动时间)
2230xdf Load/Unload Retry Count加载/卸载重试次数 磁头改变位置时所需时间。
2240xe0 Load Friction负载摩擦
Dark Green Arrow Down.svg
读写时由于机械摩擦做成的阻力。
2250xe1 Load/Unload Cycle Count加载/卸载循环计数
Dark Green Arrow Down.svg
总负载周期计数。
2260xe2 Load 'In'-time磁头 磁头加载所需总时间(不包括在停泊区的花费)。
2270xe3 Torque Amplification Count扭矩放大计数
Dark Green Arrow Down.svg
尝试来补偿盘片的速度变化的计数。
2280xe4 Power-Off Retract Cycle断电缩回周期
Dark Green Arrow Down.svg
切断电源后电磁枢自动缩回的时间计数。
2300xe6 GMR Head AmplitudeGMR磁头振幅 磁头振幅计数(磁头反复正反向运动距离)。
2310xe7 Temperature硬盘温度
Dark Green Arrow Down.svg
记录硬盘温度。
2320xe8 Endurance Remaining耐久性剩余 磁盘可使用周期与设计可使用周期的百分比。
2320xe8 Available Reserved Space可用保留空间 Intel固态硬盘报告的可提供的预留空间占作为一支全新的固态硬盘预留空间的百分比。
2330xe9 Power-On Hours加电时间 处于开机状态的小时数。
2330xe9 Media Wearout Indicator介质耗损指标 Intel固态硬盘报告的NAND刷写寿命,全新时值为100,最低值为1,其跌幅随NAND的擦除周期增加而在0到最大额定周期范围减少。
2400xf0 Head Flying Hours磁头飞行时间 磁头处于定位中的时间。
2400xf0 Transfer Error Rate传输错误率 在数据传输时连接被重置的次数计数。(Fujitsu特有属性)
2410xf1 Total LBAs WrittenLBA写入总数 LBA写入总数计数。
2420xf2 Total LBAs ReadLBA读取总数 LBA读取总数计数,部分S.M.A.R.T.检测程序会把原始值显示为负数,这是因为该原始值为48位,而不是32位的。
2500xfa Read Error Retry Rate读取错误重试率
Dark Green Arrow Down.svg
从磁盘读取时的错误计数。
2540xfe Free Fall Protection自由跌落保护
Dark Green Arrow Down.svg
对“自由落体事件”检测计数。
SMART属性解释:

1,ID# :  属性ID, 从1到255.

2,ATTRIBUTE_NAME : 属性名.

3,FLAG : 表示这个属性携带的标记. 使用-f brief可以打印.

4,VALUE: Normalized value正常值, 取值范围1到254. 越低表示越差. 越高表示越好.

当前值是各ID项在硬盘运行时根据实测数据(RAW_VALUE)通过公式计算的结果,计算公式由硬盘厂家自定。 硬盘出厂时各ID项目都有一个预设的最大正常值,也即出厂值,这个预设的依据及计算方法为硬盘厂家保密,不同型号的硬盘都不同,最大正常值通常为100或200或253,

新硬盘刚开始使用时显示的当前值可以认为是预设的最大正常值(有些ID项如温度等除外)。

随着使用损耗或出现错误,当前值会根据实测数据而不断刷新并逐渐减小。

因此,当前值接近临界值就意味着硬盘寿命的减少,发生故障的可能性增大,所以当前值也是判定硬盘健康状态或推测寿命的依据之一。
5,WORST: 最差值,表示SMART开启以来的, 所有Normalized values的最低值。

最差值是硬盘运行时各ID项曾出现过的最大的非正常值。 

最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。

通常,最差值与当前值是相等的,如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历过恶劣的工作环境(如温度)。
6,THRESH:阈值。当Normalized value小于等于THRESH值时, 表示这项指标已经failed了
注意, 如果这个属性是pre-failure的, 那么这项如果出现Normalized value<=THRESH, 那么磁盘将马上failed掉.
7,TYPE:这里存在两种TYPE类型, Pre-failed和Old_age. 

Pre-failed 类型的Normalized value可以用来预先知道磁盘是否要坏了. 例如Normalized value接近THRESH时, 就赶紧换硬盘吧.
Old_age 类型的Normalized value是指正常的使用损耗值, 当Normalized value 接近THRESH时, 也需要注意, 但是比Pre-failed要好一点.
8,UPDATED:这个字段表示这个属性的值在什么情况下会被更新.
一种是通常的操作和离线测试都更新(Always), 

另一种是只在离线测试的情况下更新(Offline).

9,WHEN_FAILED:这个字段表示当前这个属性的状态。取值有以下三种:
failing_now(normalized_value <= THRESH),

或者in_the_past(WORST <= THRESH), 

或者 - , 正常(normalized_value以及wrost >= THRESH).

10,RAW_VALUE:表示这个属性的未转换前的RAW值, 可能是计数, 也可能是温度, 也可能是其他的.
注意RAW_VALUE转换成Normalized value是由厂商的firmware提供的, smartmontools不提供转换.

2,固态硬盘(SSD)的SMART表定义则目前还没有统一标准,不同厂家甚至不同主控都有可能出现相同ID不同定义,
所以用一般的SMART软件查看是没任何意义的,虽然你可以看到值,但是这个值对应的ID解释可能完全不是那么回事。

不同主控SSD的SMART属性有:

 intel SSD SMART:

03 – Spin Up Time (磁头加载时间)

04 – Start/Stop Count (开始/停止计数)

05 – Re-Allocated Sector Count (重映射扇区数)

09 – Power-On Hours Count (通电时间)

0C – Power Cycle Count (通断电次数)

C0 – Unsafe Shutdown Count (异常关机次数)

E1 – Host Writes (数据写入量)

E8 – Available Reserved Space (可用预留空间)(这个算是颗粒寿命,等于低于10%SSD就离躺倒不远了)

E9 – Media Wearout Indicator (闪存磨耗指数)

B8 – End to End Error Detection Count (端对端错误监测数)


SandForce SSD SMART:
1-Raw Read Error Rate   底层数据读取出错率
5-Retired Block Count 不可使用的坏块计数 (公式比较怪。。这个值不准,新固件都为100)
9-Power On Hours Count    累计加电时间
12-Power Cycle Count   设备通电周期
171-Program Fail Count       编程错误计数
172-Erase Fail Count         擦除错误计数
174-Unexpected Power Loss Count    不正常掉电次数
177-Wear-Range Data 显示最大磨损块和最小磨损块相差的百分比
181-同171定义相同
182-同172定义相同
187-Reported Uncorrectable Errors 不可修复错误计数
194-显示温度的,基本可以忽略(假的)
195-On the Fly Reported Uncorrectable Error Count    实时不可修复错误计数
196-Reallocated Event Count                      重映射坏块计数
231-SSD Life left      SSD剩余寿命 
     新盘为100,当显示为10,代表P/E用完了,但是还有备用空间可以替换,显示0代表盘上数据为只读。
241-lifetime write froms host         来自主机的写入数据量总数(64G更新一次)
242-lifetime write froms host         来自主机的读取数据量总数(64G更新一次)


Micron(镁光)SSD SMART:
1-Raw Read Error Rate                          底层数据读取出错率
5-Re-allocated Sectors Count                 使用中新增的坏块数
9-Power On Hours Count                       累计加电时间
12-Power Cycle Count                             设备通电周期
170-Grown Failing Block Count                   替换坏块计数
171-Program Fail Count                             编程错误计数
172-Erase Fail Count                                 擦除错误计数
173-Wear Leveling Count                          平均擦写次数
174-Unexpected Power Loss Count            不正常掉电次数
181-Non-4k Aligned Access                       非4KB对齐访问数
183-SATA Interface Downshift                   接口降级次数计数
187-Reported Uncorrectable Errors            不可修复错误计数
188-Command Timeout                            指令超时计数
189-Factory Bad Block Count                    出厂坏块计数
196-Re-allocation Event Count                  坏块重映射事件计数
197-Current Pending Sector Count           值永远为0
198-Smart Off-line Scan Uncorrectable Error Count     自检时发现的不可修复错误
199-Ultra DMA CRC Error Rate                 主机到接口之间传输CRC错误率
202-Percentage Of The Rated Lifetime Used   剩余寿命(MLC 5000 / SLC 100000计算) 
                       百分比从100开始跌
206-Write Error Rate 底层数据写入出错率
我觉得最主要的是那个173/AD的值,那个值是平均块擦写次数,用户可以靠它判断自己的盘剩余寿命。


Indilinx SSD SMART:
1-Raw Read Error Rate底层数据读取出错率
9-Power On Hours Count累计加电时间
12-Power Cycle Count设备通电周期
184-Init Bad Block Count坏块数
195-Program Failure block Count编程错误块计数
196-Erase Failure block Count擦除错误块计数
197-Read Failure block Count读取错误块计数(不可修复错误)
198-Total Count of Read Sectors总读取页数
199-Total Count of Write Sectors总写入页数
200-Total Count of Read Command总读取指令数
200-Total Count of Write Command总写入指令数
202-Total Count of error bits from flash总闪存错误bit数
203-Total Count of Read Sectors with correct bits error  总修复bit错误的读取页数字
204-BAD Block Full Flag
205-Max P/E Count最大可编程/擦除次数  MLC 5000/10000   or SLC 100000
206-Erase Count Min最小擦写次数
207-Erase Count Max最大擦写次数
208-Erase Count Average平均擦写次数
209-Remaining Life %剩余寿命百分比
210-BBM Error Log坏块管理错误日志
211-SATA Error Count CRC (Write)     SATA 主机 <->接口CRC写入错误计数
212-SATA Error Count HANDSHAKE (Read)  SATA 主机 <->接口读取错误计数

  • 5
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要说Linux用户最不愿意看到的事情,莫过于在毫无警告的情况下发现硬盘崩溃了。诸如RAID的备份和存储技术可以在任何时候帮用户恢复数据,但为预防硬件崩溃造成数据丢失所花费的代价却是相当可观的,特别是在用户从来没有提前考虑过在这些情况下的应对措施时。 硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。后者偶而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在在几天甚至几星期前就发现这种不正常的现象。 对于可预测的情况,如果能通过磁盘监控技术,通过测量硬盘的几个重要的安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。那么在发生故障前,至少有足够的时间让使用者把重要资料转移到其它储存设备上。 最早期的硬盘监控技术起源于1992年,IBM在AS/400计算机的IBM 0662 SCSI 2代硬盘驱动器中使用了后来被命名为Predictive Failure Analysis(故障预警分析技术)的监控技术,它是通过在固件中测量几个重要的硬盘安全参数和评估他们的情况,然后由监控软件得出两种结果:“硬盘安全”或“不久后会发生故障”。 SMART的目的是监控硬盘的可靠性、预测磁盘故障和执行各种类型的磁盘自检。如今大部分的ATA/SATA、SCSI/SAS和固态硬盘都搭载内置的SMART系统。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值