DDR4 SDRAM -1. 理解基本原理

awildchild1

已于 2024-07-30 06:46:50 修改

阅读量301

点赞数 5

文章标签：学习 DRAM

于 2024-07-30 06:42:52 首次发布

本文链接：https://blog.csdn.net/awildchild1/article/details/140786165

版权

DDR4 SDRAM -1. 理解基本原理

引子：

最近在看DDR4方面的材料，Google到了一硬件大佬的Blog，近期几篇将会翻译学习下文章。强烈推荐感兴趣的同学可以去阅读原文。
本篇文章原文：DDR4 Tutorial - Understanding the Basics - systemverilog.io

绪论

DDR4 SDRAM在ASIC和FPGA设备中使用非常普遍。在这篇文章中，我们将探讨一些基本知识。

• DDR4 SDRAM的内部是什么样子的？
• 在诸如READ和WRITE等基本操作过程中发生了什么，以及
• SDRAM子系统的高级图画，即你的ASIC/FPGA怎样才能与DDR4 SDRAM存储器进行对话

物理结构

一个好的开始是看看一些基本的IO，并了解它们的功能是什么。从这里开始，我们将深入研究，直到了解构成DRAM存储器的基本单元。

顶层

正如你所期望的那样，DRAM有时钟、复位、芯片选择、地址和数据输入。下面的表格对每一个输入都有更多的细节。这并不是一个完整的IO列表，这里只列出了基本的IO。请花一点时间仔细阅读每个IO的作用，特别是双功能地址输入

Figure 1: Top Level

符号	类型	功能描述
RESET_n	Input	只有当该信号为高电平时，DRAM才处于激活状态
CS_n	Input	只有当它为低电平时，内存才会查看其他所有的输入
CKE	Input	时钟使能。高电平激活内部时钟信号和设备输入缓冲器和输出驱动器
CK_t/CK_c	Input	差分时钟输入。所有的地址和控制信号在CK_t的正沿和CK_n的负沿交叉时被采样。
DQ/DQS	Input	数据总线和数据选通。这就是数据被写入和读出的方式。选通器本质上是一个数据有效标志
RAS_n/A16 CAS_n/A15 WE_n/A14	Input	这些是双重功能的输入。当ACT_n和CS_n为低电平时，它们被解释为行地址位。当ACT_n为高电平时，它们被解释为命令引脚以指示 READ、WRITE 或其他命令
ACT_n	Input	激活指令输入
BG0-1 BA0-1	Input	bank Group、bank地址
A0-13	Input	地址输入

BankGroup, Bank, Row, Column

顶层图片显示了 DRAM 的外在。再往下看，这就是内存的组织方式----bank Group和banks

Figure 2: BankGroup & Bank

要从内存中读出，你要提供一个地址，而要向它写入，你还要提供数据。这个由用户提供的地址，通常被称为 "逻辑地址"。

这个逻辑地址在被提交给DRAM之前被翻译成物理地址。物理地址是由以下字段组成的：

• Bank Group
• Bank
• Row #行
• Column #列

然后，这些单独的字段被用来识别内存中的确切位置，以便进行读出或写入

再继续往下看，这就是你将在每个bank中看到的内容。

• Memory Arrays    #内存阵列
• Row Decoder    #行解码器
• Column Decoder #列解码器
• Sense Amplifiers    #感应放大器

Figure 3: Row & Column解码

一旦识别了Bank Group和Bank，地址的Row部分将激活内存阵列中的一行。这一行称为word line(字线) ，激活它会将数据从内存阵列读取到Sense Amplifiers感应放大器 中。然后，列地址读出加载到Sense Amplifiers感应放大器 中的 部分字。列的宽度称为Bit Line(位线) 【即部分字的宽度】

列的宽度是标准的 - 它是 4 位、8 位或 16 位宽，DRAM 根据此列宽分为 x4、x8 或 x16。另外需要注意的是，DQ 数据总线的宽度与列宽相同。因此，为简化起见，您可以说 DRAM 是根据 DQ 总线的宽度进行分类的。
[旁注：x16 设备只有 2 个 Bank Group，而 x4 和 x8 有 4 个，如图 2 所示。]

类比时间：一块DRAM芯片相当于一栋满是文件柜的大楼

Bank Group → 确定楼层
Bank Address → 确定你所需要的文件在该楼层的文件柜
Row Address → 识别文件在柜子里的哪个抽屉。将数据读入感应放大器，相当于打开/拉出文件抽屉。
Col Address → 识别该抽屉内的文件编号

在最底层，一个比特本质上是一个保持电荷的电容和一个充当开关的晶体管。

Figure 4: Bit

由于电容会随着时间的推移而放电，除非定期对电容器进行刷新，否则信息最终会消失。这就是DRAM中 "D "的由来--它指的是动态，而不是SRAM（静态随机存取存储器）

DRAM的大小和寻址

DRAM有标准尺寸，这在JEDEC规格中有所规定。JEDEC是决定DDR存储器的设计和路线图的标准委员会。这是来自DDR4 JEDEC规范（JESD79-4B）的第2.7节。

Figure 5: 寻址

DRAM 大小计算

让我们尝试通过手工计算其中的两个尺寸，使上表更有意义一些。

	`/* 4Gb x4 Device / / 4Gb x8 Device */`
	`Number of Row Address bits: A0-A15 = 16 bits Number of Row Address bits: A0-A14 = 15 bits`
	`Total number of row = 2^16 = 64K Total number of row = 2^15 = 32K`
	`Number of Column Address bits: A0-A9 = 10 bits Number of Column Address bits: A0-A9 = 10 bits`
	`Number of columns per row = 1K Number of columns per row = 1K`
	`Width of each column = 4 bits Width of each column = 8 bits`
	`Number of Bank Groups = 4 Number of Bank Groups = 4`
	`Number of Banks = 4 Number of Banks = 4`

	`Total DRAM Capacity = Total DRAM Capacity =`
	`Num.Rows x Num.Rows x`
	`Num.Columns x Width.of.Column x Num.Columns x Width.of.Column x`
	`Num.BankGroups x Num.Banks Num.BankGroups x Num.Banks`

	`Total DRAM Capacity = Total DRAM Capacity =`
	`64K x 1K x 4 x 4 x 4 = 4Gb 32K x 1K x 8 x 4 x 4 = 4Gb`

DRAM Page Size

在上面的表格中，提到了页面大小。页面大小本质上是指每行的比特数。或者换个说法，它是当一行被激活时加载到感应放大器的位数。由于列地址是10位宽，每行有1K位线。因此，对于一个X4设备，比特数是1K x 4 = 4K比特（或512B）。同样，对于x8设备，每页是1KB，对于x16设备，每页是2KB。

Rank（深度级联）

在处理DRAM时，你会遇到一些术语，如Single-Rank、Dual-Rank或Quad-Rank。Rank 是最高的逻辑单元，通常用于增加系统的内存容量。
假设你需要16Gb的内存。取决于市场上有哪些产品，哪些产品更便宜，你可以有一个16Gb的内存芯片，在这种情况下，你会称之为Single Rank系统，因为你只需要一个ChipSelect信号（CS_n）来读取内存的所有内容。或者你可以选择在PCB上焊接2个独立的8Gb器件（因为2x8Gb器件刚好比1x16Gb便宜）。在这种情况下，这两个设备将被连接到相同的地址和数据总线上，但你需要两个ChipSelects来分别给每个设备寻址。因为你需要两个ChipSelects，所以这种配置被称为Dual-Rank。

[旁注：你可能会遇到的另一个DRAM品种是 "双die封装 "或DDP。在这种情况下，你会有一个焊接在电路板上的单一DRAM芯片，但在封装内部上，它是一个2个die的堆叠。每个芯片将再次共享地址和数据线，但将有独立的芯片选择，使其成为一个Dual Rank设备。］

Figure 6: Rank

宽度级联

另一个例子 - 假设您需要一个 8Gb 内存，并且您的芯片接口是 x8。然后，您可以选择一个 8Gb x8 设备或两个 4Gb x4 设备，并在 PCB 上以“宽度级联”方式连接它们。在宽度级联的情况下，两个DRAM都连接到相同的芯片选择、地址和命令总线上，但使用不同的数据总线部分（DQ和DQS）。在下图中，第一个X4 DRAM连接到DQ[3:0]，第二个连接到DQ[7:4]。

Figure 7: DRAMs宽度级联

访问内存

• 对DDR4 SDRAM的读和写操作是以突发为导向的。它从一个选定的位置开始（由用户提供的地址指定），并继续进行4个或8个突发长度。
• 读取和写入操作是一个两步过程。它以 ACTIVATE 命令开始（ACT_n 和 CS_n 在一个时钟周期内变为低电平），然后是 RD 或 WR 命令。
• 与 ACTIVATE 命令同时注册的地址位用于选择要激活的 BankGroup、Bank 和 Row（x4/8 中的 BG0-BG1 和 x16 中的 BG0 选择 bankgroup；BA0-BA1 选择 bank；A0-A17 选择row）。此步骤也称为 RAS - Row Address Strobe(RAS - 行地址选通)
• 与读或写命令同时注册的地址位用于选择突发操作的起始列位置。此步骤也称为CAS - Column Address Strobe(CAS - 列地址选通)。
• 每个bank只有一组感应放大器。在对同一bank的不同行进行读/写之前，必须使用PRECHARGE命令解除当前打开的row的激活。PRECHARGE相当于关闭柜子里当前的文件抽屉，它使感应放大器中的数据被写回row中。
• 可以使用 RDA（自动预充电读取）和 WRA（自动预充电写入）命令，而不是发出显式 PRECHARGE 命令来停用行。这些命令告诉 DRAM 在读取或写入操作完成后自动停用/预充电行。由于列地址只使用地址位A0-A9，A10在CAS期间是一个未使用的位，它被重载以指示自动预充电。

命令真值表

我经常提到一些叫做“命令”的东西——ACTIVATE 命令、PRECHARGE 命令、READ 命令、WRITE 命令。但在本文的第一张图片中，DRAM 没有“命令”输入。那么这些命令是如何发出的呢？
真相是，DRAM 根据下面的真值表将 ACT_n、RAS_n、CAS_n 和 WE_n 输入解释为命令。

Function	Shortcode	CS_n	ACT_n	RAS_n/A16	CAS_n/A15	WE_n/A14	A10/AP
Refresh	REF	L	H	L	L	H	H or L
Single Bank Precharge	PRE	L	H	L	H	L	L
Bank Activate	ACT	L	L	Row Address	Row Address	Row Address	Row Address
Write	WR	L	H	H	L	L	L
Write with Auto-Precharge	WRA	L	H	H	L	L	H
Read	RD	L	H	H	L	H	L
Read with Auto-Precharge	RDA	L	H	H	L	H	H

部分命令真值表

上面的表格只是你可以向DRAM发出的命令的一个子集。整个DDR4命令真值表在JEDEC规范JESD79-4B的第4.1节中规定。

Read

Figure 8: 读操作

图8显示了突发长度为8（BL8）的READ操作的时序图。

• 第一步是一个ACT命令。这时地址总线上的值表示行地址。
• 在第二步，发出RDA（自动预充电的读）。这时地址总线上的值是列地址。
• RDA命令告诉DRAM在读取完成后自动PRECHARGEs bank。

Write

Figure 9: 写操作

图9是WRITE操作的时序图。

• 第一步激活一行
• 然后发出 2 个 WRITE 命令。第一个寻址COL，第二个寻址COL+8。
• 第二个写入操作之前不需要 ACT，因为我们要写入的行已经在Sense Amps(感应放大器)中被激活了。
• 还要注意的是，第一条命令是一个普通的WR，所以它使行处于激活状态。第二条命令是WRA，它在写完后取消了该行的激活。

[旁注：我在这里偷偷加了点东西，没有过多解释。A16、A15和A14不是唯一具有双重功能的地址位。自动预充电命令通过 A10 发出，如果在模式寄存器中启用，则通过 A12 选择 BurstChop4 (BC4) 或 BurstLength8 (BL8) 模式]

DRAM子系统

现在我们已经对DRAM进行了足够长的讨论，现在是时候谈谈ASIC或FPGA需要什么来与DRAM对话。这就是所谓的DRAM子系统，它由三个部分组成：
• DRAM存储器本身，包括上述的所有内容
• DDR PHY物理层
• DDR控制器

Figure 10: DRAM子系统

上面的图片中发生了很多事件，所以让我们把它分解一下：
• DRAM 被焊接在板上。 PHY 和控制器以及用户逻辑通常是同一 FPGA 或 ASIC 的一部分。
• 用户逻辑和控制器之间的接口可以是用户定义的，不需要是标准的。
• 当用户逻辑向控制器发出读或写请求时，它会发出一个逻辑地址
• 然后控制器将此逻辑地址转换为物理地址并向 PHY 发出命令。
• 控制器和 PHY 通过称为 DFI 接口的标准接口相互通信。你可以从这里下载DFI的规范。
• 然后，PHY完成所有低级别的信令，并将物理接口驱动到 DRAM。
• JEDEC标准中规定了PHY和存储器之间的这种接口。JESD79-49B specification

将控制器视为大脑，将 PHY 视为肌肉。
• 当你激活一个行时，整个页面会被加载到Sense Amps中，所以对一个已经打开的页面进行多次读取，成本较低，因为你可以跳过激活行的第一步。控制器通常有能力对用户发出的请求重新排序，以利用这一优势。为了进行重新排序，它使用了一个小的缓存或TCAM，并总是返回最新的数据，所以你不必担心陈旧的数据或由于控制器的重新排序而发生的碰撞
• PHY包含模拟驱动器，并提供调整寄存器的能力，以增加驱动强度或变更终止，以改善信号完整性。

概括地说

我们来总结一下:
• DRAM包含Bank Groups, Bank, Row & Columns。
• 用户发出的地址被称为逻辑地址，并由DRAM控制器将其转换为物理地址，然后提交给DRAM。
• 根据DQ数据总线的宽度，DDR4 DRAM被分为x4、x8或x16。
• 可以通过深度级联或宽度级联 DRAM 以达到所需的大小。
• 读取和写入操作是一个两步过程。第一步激活一行，第二步读取或写入内存
• DRAM子系统由存储器、PHY层和控制器组成。

本文来自博客园，作者：miyan，转载请注明原文链接：https://www.cnblogs.com/xyjk1002-rejuvenation/p/16407729.html

awildchild1

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
DDR4 SDRAM -1. 理解基本原理

取决于市场上有哪些产品，哪些产品更便宜，你可以有一个16Gb的内存芯片，在这种情况下，你会称之为Single Rank系统，因为你只需要一个ChipSelect信号（CS_n）来读取内存的所有内容。为了进行重新排序，它使用了一个小的缓存或TCAM，并总是返回最新的数据，所以你不必担心陈旧的数据或由于控制器的重新排序而发生的碰撞。同样，对于x8设备，每页是1KB，对于x16设备，每页是2KB。在这种情况下，你会有一个焊接在电路板上的单一DRAM芯片，但在封装内部上，它是一个2个die的堆叠。
复制链接

扫一扫