DDR5的On Die ECC

最新推荐文章于 2025-03-25 23:47:49 发布

i基本古古怪怪听听歌

最新推荐文章于 2025-03-25 23:47:49 发布

阅读量1.8k

点赞数 5

文章标签： c语言嵌入式硬件硬件工程驱动开发 fpga开发硬件架构基带工程

本文链接：https://blog.csdn.net/2401_82550753/article/details/137284949

版权

本文介绍了ECC（ErrorCorrectionCode）在数据安全和高可靠性中的作用，着重讲解了Rowhammer内存错误和两种ECC类型—边带ECC（在CPU到内存路径上实现）和OndieECC（在内存颗粒芯片上实现），并比较了它们的差异和适用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ECC的介绍：

ECC，全称是Error Correction Code，也就是用于检查并且纠正错误的一个机制。这对于数据安全和高可靠的应用来说非常重要。

ECC内存系统可以检查并且纠正出单bit的内存错误，而对于多比特的内存错误，取决于多比特的数量和ECC的算法，有可能会被纠正，也有可能只是被检测出来。接下来我们介绍一个典型的内存错误。

Row hammer——一种经典的内存硬件错误

在服务器行业工作久一点的朋友可能熟悉一种错误，叫做row hammer fault，这个错误在DDR3时代被暴露并且关注，并且在后续时间内被利用生成row hammer攻击。Row Hammer就是狂锤某一行，隔山打牛，让隔壁的行不寒而栗，在颤抖中改变立场。

这里再用通俗一点的语言解释一下row hammer：在之前的文章中我们介绍了DDR数据读取的过程，是通过ACT命令激活某一行row，读取到sense amp中，之后再写回到原来的cell。由于DDR芯片密度的增高，这种频繁的读写会对临近行（row）产生影响，多次之后甚至会造成该cell的电量变化，进一步引起电平翻转。