磁盘SMART信息详解

最新推荐文章于 2024-08-17 17:42:34 发布

_银叶先生

最新推荐文章于 2024-08-17 17:42:34 发布

阅读量3.2w

点赞数 6

分类专栏：编程知识点

本文链接：https://blog.csdn.net/chengm8/article/details/28601097

版权

编程知识点专栏收录该内容

25 篇文章 1 订阅

订阅专栏

1,机械硬盘的SMART表定义已经有自己的标准，由于硬盘厂很多，很多厂家属性的名字也不尽相同，

或者某些厂牌缺少某些属性，但是同个ID的定义是相同的。机械硬盘的SMART属性表如下：

ID	ID十六进制值	英文名	中文译名	说明
1	0x01	read error rate	底层数据读取错误率	存储器从一个硬盘表面读取数据时发生的错误率。原始值由于不同厂商的不同计算方法而有所不同，其十进制值往往无意义的。一般来说有数值意味着磁头已出现问题了。
2	0x02	Throughput Performance	读写通量性能	通常是硬盘读写性能的测量值，如果其值有变动，有可能硬盘出现了问题。
3	0x03	Spin-Up Time	盘片启动时间	盘片由静止启动加速到稳定正常运行速度的平均所需时间。
4	0x04	Start/Stop Count	电机起停次计数	一个盘片启动关闭周期的统计值，只有硬盘从完全断电中启动或从睡眠模式恢复，盘片主轴电机被启动时才会记一次数。
5	0x05	Reallocated Sector Count	重定位磁区计数	记录由于损坏而被映射到无损的后备区的扇区计数。当硬盘出现损坏扇区时，可以通过将其物理空间指向到特定的无损区域进行重映射修复，从而出现坏扇区的硬盘仍可使用。但当高过一定数值后，后扇区消耗殆尽而无法再重映射修复时，这些坏扇区就会显现出来且无法自行修复。除外由于要要求磁头读取这些坏扇区时专门再移动到后备区读写数据，对硬盘读写性能也有影响。
6	0x06	Read Channel Margin	信道读取余量	读取数据时信道可用的余量，该属性没制定任何功用。
7	0x07	Seek Error Rate	寻道错误率	（该属性是特定制造商才有的）磁头寻找磁道由于机械问题而出错几率，有多种原因可能引致出错，如：磁头伺服构件，盘体过热，或损坏。于不同厂商的不同计算方法而有所不同，其十进制值往往无意义的。
8	0x08	Seek Time Performance	寻道性能	每次寻道时间的平均值，该值短期内迅速减少，有可能硬盘出现了问题。
9	0x09	Power-On Hours	硬盘加电时间	硬盘自出厂以来加电启动的统计时间，单位为小时（或根据制造商设定为分钟或秒），一般用户以该值判定硬盘是否被使用过。
10	0x0a	Spin Retry Count	电机起转重试	S.M.A.R.T参数电机起转重试，表明了主轴电机的启动尝试次数。这个属性存储了关于主轴电机尝试加速到完全可操作速度的次数（在这种情况下，意味着主轴电机的第一次启动尝试没有成功）。主轴电机频繁的尝试启动，意味着硬盘驱动器的寿命可能将近实际限值。
11	0x0b	Recalibration Retries	磁头校准重试	磁头在一次运行失败时尝试校准至正常状态的统计数，该值改变时意味着硬盘的机械部件已经出现问题了。
12	0x0c	Power Cycle Count	设备开关计数	该属性表示硬盘电源充分开/关循环计数。
13	0x0d	Soft Read Error Rate	软件读取错误率	操作系统读取数据时的出错率。
183	0xb7	SATA Downshift Error Count	SATA降级运行计数	Western Digital 和 Samsung 特有属性，记录由于兼容问题导致降低SATA传输级别运行的计数。
184	0xb8	End-to-End error	终端校验出错	HP专有S.M.A.R.T.（SMART IV）技术的一个特有属性，记录硬盘从盘片读取数据到高速缓存后再传输到主机时数据校验出错的次数。
185	0xb9	Head Stability	磁头稳定性	Western Digital特有属性
186	0xba	Induced Op-Vibration Detection		Western Digital特有属性
187	0xbb	Reported Uncorrectable Errors	报告不可纠正错误	硬件ECC无法恢复的错误计数。
188	0xbc	Command Timeout	通信超时	由于无法连接至硬盘而终止操作的统计数，一般为0，如果远超过0，则可能电源问题，数据线接口氧化或更严重的问题。
189	0xbd	High Fly Writes	磁头写入高度	硬盘进行写入时对磁头高度进行监控以提供额外的保障。当磁头处于不正常高度进行写入时，写入操作会被终止，原有数据重写入或者将该扇区重映射到安全区域。该属性是统计值。
190	0xbe	Airflow Temperature	气流温度	Western Digital特有属性，计量硬盘内气流温度，和检测项0xc2相似。
191	0xbf	G-sense Error Rate	加速度错误率	计量可能对硬盘做成损害的冲击次数。
192	0xc0	Power-off Retract Count	电源关闭磁头收回计数	计量磁头在没有加电时不移进硬盘的值。
193	0xc1	Load Cycle Count	磁头升降计数	计量磁头在加电时移进/移出硬盘周期的值。
194	0xc2	Temperature	温度	计量硬盘的温度
195	0xc3	Hardware ECC Recovered	硬件ECC恢复	（特定原始值）
196	0xc4	Reallocation Event Count	重定位事件计数	记录已重映射扇区和可能重映射扇区的事件计数。
197	0xc5	Current Pending Sector Count	等候重定的扇区计数	记录了不稳定的扇区的数量。
198	0xc6	Uncorrectable Sector Count	无法校正的扇区计数	记录肯定出错的扇区数量。
199	0xc7	UltraDMA CRC Error Count	UltraDMA通讯CRC错误	记录硬盘通讯时发生的CRC错误。
200	0xc8	Multi-Zone Error Rate	多区域错误率	写入一个区域时发现的错误的计数。
200	0xc8	Write Error Rate	写入错误率	Fujitsu的特别属性，写入一个区域时发现的错误的计数。
201	0xc9	Soft Read Error Rate	逻辑读取错误率	记录脱轨错误。
202	0xca	Data Address Mark errors	数据地址标记错误	记录数据地址标记错误（或制造商特定的计数）
203	0xcb	Run Out Cancel	用完取消	ECC错误计数
204	0xcc	Soft ECC Correction	逻辑ECC纠正	记录由软件ECC更正的错误计数。
205	0xcd	Thermal Asperity Rate	热嘈率	记录高温导致的出错记数。
206	0xce	Flying Height	飞行高度	记录磁头的飞行高度。飞得太低会增加磁头撞毁的机会，飞得太高增加读写错误的机会。
207	0xcf	Spin High Current	主轴电机浪涌电流计数	记录主轴电机运转时浪涌电流的次数。
208	0xd0	Spin Buzz		记录由于电力不足而启动主轴电机的蜂鸣声次数。
209	0xd1	Offline Seek Performance	离线寻址性能	在其内部测试硬盘的寻址能力表现。
210	0xd2	？	？	（没定性，出现在Maxtor 6B200M0 200GB 和Maxtor 2R015H1 15GB 的硬盘中）
211	0xd3	Vibration During Write	写操作震动	记录写入操作的震动数。
212	0xd4	Shock During Write	写操作冲击	记录写入操作时的冲击数。
220	0xdc	Disk Shift	盘体偏移	记录盘体由于冲击或温度导致偏离主轴的相对距离。
221	0xdd	G-Sense Error Rate	加速计出错率	从外部诱发的冲击和振动产生的错误计数。
222	0xde	Loaded Hours	数据加载时间	数据读取时所花费的时间。（磁头移动时间）
223	0xdf	Load/Unload Retry Count	加载/卸载重试次数	磁头改变位置时所需时间。
224	0xe0	Load Friction	负载摩擦	读写时由于机械摩擦做成的阻力。
225	0xe1	Load/Unload Cycle Count	加载/卸载循环计数	总负载周期计数。
226	0xe2	Load 'In'-time	磁头	磁头加载所需总时间（不包括在停泊区的花费）。
227	0xe3	Torque Amplification Count	扭矩放大计数	尝试来补偿盘片的速度变化的计数。
228	0xe4	Power-Off Retract Cycle	断电缩回周期	切断电源后电磁枢自动缩回的时间计数。
230	0xe6	GMR Head Amplitude	GMR磁头振幅	磁头振幅计数（磁头反复正反向运动距离）。
231	0xe7	Temperature	硬盘温度	记录硬盘温度。
232	0xe8	Endurance Remaining	耐久性剩余	磁盘可使用周期与设计可使用周期的百分比。
232	0xe8	Available Reserved Space	可用保留空间	Intel固态硬盘报告的可提供的预留空间占作为一支全新的固态硬盘预留空间的百分比。
233	0xe9	Power-On Hours	加电时间	处于开机状态的小时数。
233	0xe9	Media Wearout Indicator	介质耗损指标	Intel固态硬盘报告的NAND刷写寿命，全新时值为100，最低值为1，其跌幅随NAND的擦除周期增加而在0到最大额定周期范围减少。
240	0xf0	Head Flying Hours	磁头飞行时间	磁头处于定位中的时间。
240	0xf0	Transfer Error Rate	传输错误率	在数据传输时连接被重置的次数计数。（Fujitsu特有属性）
241	0xf1	Total LBAs Written	LBA写入总数	LBA写入总数计数。
242	0xf2	Total LBAs Read	LBA读取总数	LBA读取总数计数，部分S.M.A.R.T.检测程序会把原始值显示为负数，这是因为该原始值为48位，而不是32位的。
250	0xfa	Read Error Retry Rate	读取错误重试率	从磁盘读取时的错误计数。
254	0xfe	Free Fall Protection	自由跌落保护	对“自由落体事件”检测计数。

SMART属性解释:

1，ID# : 属性ID, 从1到255.

2，ATTRIBUTE_NAME : 属性名.

3，FLAG : 表示这个属性携带的标记. 使用-f brief可以打印.

4，VALUE: Normalized value正常值, 取值范围1到254. 越低表示越差. 越高表示越好.

当前值是各ID项在硬盘运行时根据实测数据(RAW_VALUE)通过公式计算的结果，计算公式由硬盘厂家自定。硬盘出厂时各ID项目都有一个预设的最大正常值，也即出厂值，这个预设的依据及计算方法为硬盘厂家保密，不同型号的硬盘都不同，最大正常值通常为100或200或253，

新硬盘刚开始使用时显示的当前值可以认为是预设的最大正常值（有些ID项如温度等除外）。

随着使用损耗或出现错误，当前值会根据实测数据而不断刷新并逐渐减小。

因此，当前值接近临界值就意味着硬盘寿命的减少，发生故障的可能性增大，所以当前值也是判定硬盘健康状态或推测寿命的依据之一。
5,WORST: 最差值，表示SMART开启以来的, 所有Normalized values的最低值。

最差值是硬盘运行时各ID项曾出现过的最大的非正常值。

最差值是对硬盘运行中某项数据变劣的峰值统计，该数值也会不断刷新。

通常，最差值与当前值是相等的，如果最差值出现较大的波动（小于当前值），表明硬盘曾出现错误或曾经历过恶劣的工作环境（如温度）。
6，THRESH：阈值。当Normalized value小于等于THRESH值时, 表示这项指标已经failed了。
注意, 如果这个属性是pre-failure的, 那么这项如果出现Normalized value<=THRESH, 那么磁盘将马上failed掉.
7，TYPE:这里存在两种TYPE类型, Pre-failed和Old_age.

Pre-failed 类型的Normalized value可以用来预先知道磁盘是否要坏了. 例如Normalized value接近THRESH时, 就赶紧换硬盘吧.
Old_age 类型的Normalized value是指正常的使用损耗值, 当Normalized value 接近THRESH时, 也需要注意, 但是比Pre-failed要好一点.
8,UPDATED:这个字段表示这个属性的值在什么情况下会被更新.
一种是通常的操作和离线测试都更新(Always),

另一种是只在离线测试的情况下更新(Offline).

9,WHEN_FAILED:这个字段表示当前这个属性的状态。取值有以下三种：
failing_now(normalized_value <= THRESH),

或者in_the_past(WORST <= THRESH),

或者 - , 正常(normalized_value以及wrost >= THRESH).

10，RAW_VALUE:表示这个属性的未转换前的RAW值, 可能是计数, 也可能是温度, 也可能是其他的.
注意RAW_VALUE转换成Normalized value是由厂商的firmware提供的, smartmontools不提供转换.

2,固态硬盘(SSD)的SMART表定义则目前还没有统一标准，不同厂家甚至不同主控都有可能出现相同ID不同定义，
所以用一般的SMART软件查看是没任何意义的，虽然你可以看到值，但是这个值对应的ID解释可能完全不是那么回事。

不同主控SSD的SMART属性有：

intel SSD SMART:

03 – Spin Up Time （磁头加载时间）

04 – Start/Stop Count （开始/停止计数）

05 – Re-Allocated Sector Count （重映射扇区数）

09 – Power-On Hours Count （通电时间）

0C – Power Cycle Count （通断电次数）

C0 – Unsafe Shutdown Count （异常关机次数）

E1 – Host Writes （数据写入量）

E8 – Available Reserved Space （可用预留空间）（这个算是颗粒寿命，等于低于10%SSD就离躺倒不远了）

E9 – Media Wearout Indicator （闪存磨耗指数）

B8 – End to End Error Detection Count （端对端错误监测数）

SandForce SSD SMART:
1-Raw Read Error Rate 底层数据读取出错率
5-Retired Block Count 不可使用的坏块计数（公式比较怪。。这个值不准，新固件都为100）
9-Power On Hours Count 累计加电时间
12-Power Cycle Count 设备通电周期
171-Program Fail Count 编程错误计数
172-Erase Fail Count 擦除错误计数
174-Unexpected Power Loss Count 不正常掉电次数
177-Wear-Range Data 显示最大磨损块和最小磨损块相差的百分比
181-同171定义相同
182-同172定义相同
187-Reported Uncorrectable Errors 不可修复错误计数
194-显示温度的，基本可以忽略（假的）
195-On the Fly Reported Uncorrectable Error Count 实时不可修复错误计数
196-Reallocated Event Count 重映射坏块计数
231-SSD Life left SSD剩余寿命
新盘为100，当显示为10，代表P/E用完了，但是还有备用空间可以替换，显示0代表盘上数据为只读。
241-lifetime write froms host 来自主机的写入数据量总数（64G更新一次）
242-lifetime write froms host 来自主机的读取数据量总数（64G更新一次）

Micron(镁光)SSD SMART:
1-Raw Read Error Rate 底层数据读取出错率
5-Re-allocated Sectors Count 使用中新增的坏块数
9-Power On Hours Count 累计加电时间
12-Power Cycle Count 设备通电周期
170-Grown Failing Block Count 替换坏块计数
171-Program Fail Count 编程错误计数
172-Erase Fail Count 擦除错误计数
173-Wear Leveling Count 平均擦写次数
174-Unexpected Power Loss Count 不正常掉电次数
181-Non-4k Aligned Access 非4KB对齐访问数
183-SATA Interface Downshift 接口降级次数计数
187-Reported Uncorrectable Errors 不可修复错误计数
188-Command Timeout 指令超时计数
189-Factory Bad Block Count 出厂坏块计数
196-Re-allocation Event Count 坏块重映射事件计数
197-Current Pending Sector Count 值永远为0
198-Smart Off-line Scan Uncorrectable Error Count 自检时发现的不可修复错误
199-Ultra DMA CRC Error Rate 主机到接口之间传输CRC错误率
202-Percentage Of The Rated Lifetime Used 剩余寿命（MLC 5000 / SLC 100000计算)
百分比从100开始跌
206-Write Error Rate 底层数据写入出错率
我觉得最主要的是那个173/AD的值，那个值是平均块擦写次数，用户可以靠它判断自己的盘剩余寿命。

Indilinx SSD SMART:
1-Raw Read Error Rate底层数据读取出错率
9-Power On Hours Count累计加电时间
12-Power Cycle Count设备通电周期
184-Init Bad Block Count坏块数
195-Program Failure block Count编程错误块计数
196-Erase Failure block Count擦除错误块计数
197-Read Failure block Count读取错误块计数（不可修复错误）
198-Total Count of Read Sectors总读取页数
199-Total Count of Write Sectors总写入页数
200-Total Count of Read Command总读取指令数
200-Total Count of Write Command总写入指令数
202-Total Count of error bits from flash总闪存错误bit数
203-Total Count of Read Sectors with correct bits error 总修复bit错误的读取页数字
204-BAD Block Full Flag
205-Max P/E Count最大可编程/擦除次数 MLC 5000/10000 or SLC 100000
206-Erase Count Min最小擦写次数
207-Erase Count Max最大擦写次数
208-Erase Count Average平均擦写次数
209-Remaining Life %剩余寿命百分比
210-BBM Error Log坏块管理错误日志
211-SATA Error Count CRC (Write) SATA 主机 <->接口CRC写入错误计数
212-SATA Error Count HANDSHAKE (Read) SATA 主机 <->接口读取错误计数