解密内存初始化带你从BIOS 小工到年薪百万

uefi_artisan

已于 2024-07-26 10:30:45 修改

阅读量2.9k

点赞数 19

文章标签： UEFI BIOS DDR

于 2024-02-27 22:10:31 首次发布

本文链接：https://blog.csdn.net/robinsongsog/article/details/136333139

版权

问题引出，为什么要内存TRAINING?

因为DDR 3/4/5 采用了FLY BY 连线方式，控制信号，命令信号还有时钟到达DIMM 端的时间不一样，TRAINING 就是为了将这些信号对齐。

内存从上电到下电会经过哪些过程：

答：初始化--> 校准--> 训练--> (刷新/读/写)--> 下电

初始化过程
内存控制器DDR 芯片上电--> 复位DDR4 芯片--> 时钟稳定CKE 使能--> MRS 寄存器模式配置

校准过程
DDR4 芯片端ZQ 校准--> 内存控制器VrefDQ 训练

训练过程
写入均衡 write leveling-->门控训练 Gate training--> 读数据去偏斜 read De skew--> 写数据去偏斜write de skew--> 写DQS 延迟训练
--> 读DQS 延迟训练 Read Eye Centering

到这个时候， DDR4 就已经基本Ready. 就可以进行正常的读写操作了。

刷新 /读操作写操作 ----> 下电

后面，我们就对上面提到的各个过程进行详细的解读。

写入均衡（Write leveling)

有书的同学打开 4.21.1 Write Leveling Training Mode.

没书的同学，私信我，我发给你，18.88 一份。

包含两本（ JEDEC SPEC + MEMORY SYSTEM Cache, DRADM, Disk).

Write leveling 是对fly by 布线的一种时序补偿。要说清楚这个，先要了解信号分类。
DDR 信号分地址，数据，控制等等大类，但是，按照布线方式，可以分为两个大类。一个DDR 控制器，往往会接很多DDR 芯片。按照布线来说，一大类就是点对点信号。比如数据信号DQ, 以及DQS, 在同一个RANK 里面，控制器到芯片都是一一对应的。那相对的，另一大类，就是共有信号。比如时钟，地址和命令信号。这些信号都是一对多连接的。于是，对于这些信号就有了两种布线方式。
第一种就是T 型布线，就是将时钟，地址，命令以T 字型，保证控制器到DDR 芯片的距离都是一样的。
第二种，就是FLY BY, FLY BY 就是将时钟，地址，命令，依次经过DDR3. 连接沿路的DDR 芯片，只留下很小的STUB, 减小反射。并且在终端做了匹配，尽可能的改善信号质量。

这是非常推荐的布线方式。但是会存在一点点问题。由于这些共有信号，都是沿路供给DDR芯片。也就意味着，控制器到各个芯片的距离都不相同。比如控制器发出的时钟CK 信号到达各个芯片的延时会有差别。而一对一信号，比如，数据DQ ,它们都是等长的。对于一对一信号，控制器到各个芯片的延时都是一样的。
于是，共有信号和一对一信号，在各个芯片上面，就有了不同步的现象。

什么叫FLY BY, 上图：

从图中，可以看出，控制信号，地址信号用一根线将所有的内存芯片串起来了，很明显信号到达每个DIMM 的时间就会不一样，因为线长不一样。另外，可以看出来，DATA 信号的数据线，是一样长的。

即然发现了问题，解决起来，就方便了，毕竟我们永远不缺解决问题的人，而是总缺发现问题的人。

问题解决：继续打开书：

从这张图可以看出，信号从MEMORY CONTROLLER 发出的时候，是对齐的。

到了DIMM 端，两边对不齐了，本来DIFF_DQS 应该是在正下方的。TRAINING 就是为了解决这个问题。

移动 DQS 去采样CLOCK, 就是对CLOCK 进行画像，比如一个CLOCK 采样128 次，每一个间隔叫一个PI(Phase Interpolator）。这样就能知道CLOCK 长什么样子了。

从上图可以看到， CLOCK 都是0， 0 OR 1 也就是说，之前是啥不用管，统计后面的就可以了。

然后，挪动一个或多个PI, 再次对CLOCK 进行采样。

有了对CLOCK 的画像，我们就能调整DQS 的延时，以达到我们的目的，也就是让DQS 和CLOCK 对齐。

具体的步骤，可以分为以下四步：
按时间T1, T2, T3, T4:
T1: 使能 ODT
T2: DDR 控制器发送DQS 信号， DDR芯片在DQS 上升沿采样CK 信号，发现CK = 0, 则DQ 保持为0.
T3: DDR 控制器加入延时后发送DQS 信号， DDR 芯片在DQS上升沿采样CK 信号，发现CK=0, 则DQ 仍然保持为0
T4: DDR 控制器继续加入延时后发送DQS 信号， DDR 芯片在DQS上升沿采样CK 信号，发现CK=1, 则等待一段时间后， DDR 芯片将DQ 信号置高。

就是用这种方法对每个DDR 芯片做写入均衡。这样对于每个芯片，看到的时钟和DQS 就椒对齐的。