解决方案
更换南桥芯片导热介质
问题经过和解决问题的思考(单纯记录自己的故事,不喜就不看了)
本人主板华硕X570-E GAMEING,CPU是5800X,2022年2月买了两块PM9A1,使用量非常小(写入在2TB这样,读取在5TB)。2月初使用时还正常,2月10日出问题,表现为如果写入较大的数据,或运行一段时间后就无法再读取数据或大部分数据无法读取。上了贴吧问了大家,大家都认为是0E问题(两块硬盘确实有一块硬盘出现了0E数据),都让换盘,但是我始终认为两块硬盘会同时出现相同问题的概率极低。于是开始了我的尝试。
(一)问题症状
1、重启后可以读取一点数据,之后再读取就开始出现“指定设备不存在”,出现后可以往里写入数据,刚写入完的数据也可以读取,但是几分钟后也是“指定设备不存在”。
2、重启后,在出现“指定设备不存在”前,可以使用系统的磁盘检测工具,也可以使用“快速格式化”,如果不勾选快速格式化,必定失败,出现“指定设备不存在”后,磁盘检测工具和格式化均无法使用。
3、重启后,在出现“指定设备不存在”前使用DiskGenius格式化可以成功。无论是DiskGenius还是HDTune检测磁盘坏道,可通过,0E数据不增长,03数据不减少。在出现“指定设备不存在”后,使用坏道检测工具均失败。
4、PM9A1的理论顺序读取是7000MB/S,但是在磁盘坏道检测时的速度只有2000MB/S。理论顺序写入是5000MB/S。
5、在重启后,出现“指定设备不存在”前,使用“TRIM”优化均可成功。出现后均失败。
6、在重启后,出现“指定设备不存在”前,可以重刷固件。
(二)分析症状
1、从上面4个症状看来,明显不是0E问题,因为0E问题出现数据损坏的情况下,根本不会给你重启后可以读取一部分数据的机会。
2、可以总结出硬盘在写的情况下,会出现“指定设备不存在”问题,但是读的时候大概率不会,而且硬盘的读取速度明显下降很大。因为硬盘一写入不久就会出现“指定设备不存在”,无法测试写入速度是否下降。加上第1点说的不是0E问题。
3、导致硬件降速的很大原因很可能是温度。
(三)尝试解决过程
1、检查散热,发现导热垫片(莱尔德90000)已经干了,不得不说这个型号虽然性能好,但是真的不耐用,之前显卡出问题也是因为这个导热垫干了。于是更换了以前买的便宜的1mm厚的导热垫片,问题依旧,再次拆开查看,发现导热垫上的压痕很浅,怀疑没压紧。想起以前用PM981A的时候也是用这个导热垫也没问题,但是想到PM9A1的发热量和PM981A相比,有可能以前也没压紧,但是以前的发热量少所以没什么影响。
2、更改了1.25mm厚的泰吉诺LV800,问题依旧。
3、此时放弃了,真怀疑是两块硬盘一起爆了,还买了新的硬盘。
4、换上新的硬盘,神奇的是,所有测试都通过了,包括顺序读写有7400MB/S和5400MB/S,应该是没问题了,结果开始登录steam下载游戏后,问题又来了,甚至更严重,直接不认硬盘了,此时头大了,心想,不是吧,运气真那么差?这几天和固态硬盘相克?没办法,把新买的硬盘退货了。
5、看着桌子上原来的两块PM9A1,不甘心,还是觉得散热有问题,买了个NVME转USB的带风扇的盒子,接在USB3.1上跑测试,测试过程没问题,这个盒子风扇作用不大,硬盘温度直接来到70度,这么高的温度也没问题,但是速度只有USB3.1的5Gb的速度。不会是因为放在机箱里温度超过70度出了问题吧?不对呀,记得以前用这个硬盘的时候,运行温度大概在55度这样。是写入速度快就出问题?更不可能呀,要是说两块都爆0E我还信有点概率,两块都因为写入速度快就出问题真不太可能了。
6、想了半天,甚至怀疑主板坏了,想着主板坏了? 常年硬盘发热过大把主板变形了? 甚至打开了购物平台,准备买个转接卡用算了,但是想到如果用转接卡,除非用X1的,不然插在X16插槽上,会导致显卡变成X8模式。用X1有感觉速度慢,不甘心(其实平时也用不上7000MB/S的速度)找了半天也没找到X4的阵列卡(全是分割卡)。然后想着PCIE4.0,PCIE4.0,我就想到了PCIE的接口,是直接连接CPU的,NVME走的也是PCIE通道,嗯?? ?我没记错的话以前看主板说明书的时候,CPU的PCIE通道不够,所以有些是通过南桥分出去的PCIE4.0通道,我就想主板上的NVME不会也是走的南桥吧。南桥坏了?
7、拆开主板南桥的散热,发现南桥用的是导热垫,而且导热垫已经干了,测量了原来导热垫的厚度是1.5MM的,手上没有合适的导热垫,于是涂上厚厚的导热硅脂替代原来的导热垫。开机,紧张的跑测试,全过了,不会再出现“设备不存在”了!!!问题解决!!!