----------------------------------------------------------------------------------------------------------------
-----------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------------------
当高能亚原子粒子穿越超大规模电路存储单元(触发器、寄存器单元或RAM单元)中的硅时,会伴随着自由电荷的产生。这些电荷在极短的时间间隔内(约15ps)会聚集在电路节点中,当电荷聚集超过一定程度,存储的数据就会改变,造成系统出错。由于它对电路的损害不是永久性的,所以这种现象称为软失效。
软失效判断方法和应对措施
是否发生软失效,可以通过软失效发生的几个特点来判断:
- 通过Reset可以恢复。
- 长期观察,发生的错误分布均匀、位置随机,错误基本上不会在同一点重现。
- 芯片能通过ATE系统测试。
- 错误发生概率与海拔高度、太阳活动周期相关。
高能量中子穿透能力强,目前业界尚无完全屏蔽手段,通行的做法是:
- 改进工艺,提高噪声容限。
- 提供软失效的检测手段:parity校验、ECC校验、CRC校验等。
- 对检测到的软失效进行主动修复(CE设备检测多bit错误复位单板修复错误)
转载自:https://wenku.baidu.com/view/1a9bfc8c360cba1aa911da41.html
https://support.huawei.com/enterprise/zh/doc/EDOC1100087022/