linux io使用dma传输,linux驱动之DMA

最新推荐文章于 2024-05-15 23:44:55 发布

刘 jin

最新推荐文章于 2024-05-15 23:44:55 发布

阅读量1.3k

点赞数 1

文章标签： linux io使用dma传输

一、前言

在嵌入式Linux 的内核及驱动中，DMA 常常被人提起。我们也许清楚它的原理且很明白它非常重要，但在某种程度上，对于 DMA 的使用者来说，我们一般使用其接口，而很少去了解整个 DMA 的运作方式。那么本文就从头到尾，简单地说一下 DMA 吧

注意：本文对DMA的概念不做讲述，请各位读者自行了解DMA的概念。

二、正文

2.1 高端内存

2.1.1 内核虚拟内存

在了解 DMA 之前，我们需要先了解一下高端内存的相关内容。这有助于我们理解 DMA。

在 32位的操作系统上，常常把程序的 0-3G(即PAGE_OFFSET) 作为用户空间，而 3-4G 作为内核空间。

e1b622234d13

用户空间与内核空间

每个进程的用户空间是完全独立、互不相干的，因为用户进程各自有不同的页表。

但内核空间是由内核负责映射，它并不会随进程切换而切换，内核空间的虚拟地址到物理地址映射是所有进程共享的。内核的虚拟空间独立其他程序。

我们重点关注一下内核的虚拟内存空间，笔者将文档 Documentation/arm/memory.txt 中的内核内存分布列表如下(有所删减)：

起始地址

结束地址

用处

0xffff8000

0xffffffff

用于 copy_user_page 和 clear_user_page

0xffff1000

0xffff7fff

保留，任何平台都不能使用该段虚拟内存空间

0xffff0000

0xffff0fff

异常向量表所在的内存区域

0xffc00000

0xffefffff

专用页面映射区(固定页面映射区)，使用 fix_to_vir()可以获取该区域的逻辑地址

0xfee00000

0xfeffffff

PCI技术的IO映射空间

VMALLOC_START

VMALLOC_END

使用 vmlloac() 和 ioremap() 获取的地址都处于该内存段

PAGE_OFFSET

high_memory-1

内存直接映射区域(常规内存映射区域)，该段内存地址也称为逻辑地址，可以用于 DMA寻址

PKMAP_BASE

PAGE_OFFSET-1

持久映射区域，一般用于映射高端内存

2.1.2 逻辑地址及高端内存

我们知道内核的虚拟地址空间为 3G-4G。在这个范围内，有一段大小为 896M 的虚拟内存是直接映射到 0-896M 的物理地址空间。逻辑地址与物理地址之间的转换是通过加上一个偏移 PAGE_OFFSET 来实现的。

按照笔者的理解：逻辑地址也是虚拟地址。其与一般虚拟地址不同的是，逻辑地址采用了线性映射，直接造成了逻辑地址与物理地址一一对应的关系。

举个例子我们可以按照一般情况来假设 PAGE_OFFSET 为 0xc0000000，那么内核虚拟空间就是 0xc0000000-0xffffffff 的 1G 空间，这会造成一个问题。如果物理地址的 0-1G 地址空间映射到虚拟地址的 0xc0000000-0xffffffff，高于物理地址 0-1G 的地址范围我们就无法访问。那么此时就产生了高端内存。

通常在 32bit的内核，将 0-896M 的物理地址空间直接映射到内存直接映射区域。将高于 896M 的物理地址映射到高端内存区域，即 PKMAP_BASE ~ PAGE_OFFSET-1 这段空间。

在访问高于 896M 的物理空间时，先从高端内存区域申请一段虚拟地址，并把需要访问的物理地址映射到该段虚拟地址，这样就可以访问高于 896M 大小的物理地址了。这种方式往往是使用 alloc_page 来获取内存。

按照上面的理解，当我们使用 vmlloc 时，也可以在 vmalloc区域分配一段虚拟地址空间来映射到物理高端内存，通过这种方式也可以访问物理高端内存。

e1b622234d13

高端内存映射

总结访问高端内存的 2 种方式：

alloc_page

vmalloc

2.1.3 DMA寻址

在 ARM架构的 Soc 上，可能会存在 DMA寻址问题，即 DMA 无法访问所有的物理地址空间，只能访问特定的物理地址空间。上面说了内存直接映射区域中可以用于 DMA，意思是说如果 Soc 只能访问特定的物理空间，该段特定物理空间常常位于内存直接映射区域。

e1b622234d13

DMA区域和常规区域

2.2 总线地址

笔者在蜗窝科技中发现关于总线地址解释的好文章 Dynamic DMA mapping Guide。笔者将根据文章中的内容并按照自己的理解描述总线地址，有兴趣的读者请访问原文。

总线地址的使用笔者目前仅在 PCI技术中见到过，所以笔者也将使用 PCI技术并结合文章来描述。

2.2.1 MMIO

MM IO 即内存映射I/O(Memory mapping I/O)，有资料说它是 PCI规范的一部分。但是按照笔者理解，在 ARM架构的 Soc 中我们经常见到。

按照笔者理解，MMIO 可以理解为一段内存地址，我们通过这段内存地址就可以直接访问对应的控制器的寄存器。举个例子，以 SPI控制器为例，我们可以在一些 ARM架构Soc的数据手册中见到 SPI控制器的寄存器地址在某一段内存地址中，我们可以直接通过访问这些地址来访问寄存器，这就是 MMIO。这样做的好处就是我们可以使用一套汇编语言即可访问外围IO设备的寄存器。

而在 x86 中，内存空间和 IO空间不是共享一段内存地址，所以需要使用另外一套 IO汇编语言来访问 IO空间，这种方式也称为 port IO。

2.2.2 例子说明

1. 访问MMIO上的寄存器

假设某 Soc 的 PCI设备在内存中有一段 MMIO空间，我们需要通过对 PCI设备的寄存器进行访问才能相应的控制 PCI 设备。

在一般情况下，在驱动中访问寄存器往往也是通过虚拟地址进行访问的。通常是使用 ioremap 对一个寄存器地址进行映射，将其映射到虚拟地址，我们通过访问这个虚拟地址即可访问寄存器。

但在 PCI 设备中，PCI桥将这些 PCI设备和系统(按笔者理解，此处可以理解为CPU) 连接在一起。PCI设备会有基地址寄存器BAR(base address register)，该寄存器表示 PCI设备在 PCI总线上的地址，即总线地址。这样做之后，就不能直接通过访问虚拟地址来访问 PCI设备的寄存器，需要使用总线地址才能访问到 PCI设备的MMIO。

如下图所示，红圈代表的是访问 PCI设备的过程：

CPU 并不能通过总线地址A直接访问 PCI设备

PCI桥(PCI host bridge) 会在 MMIO 的地址B(物理地址) 和总线地址A 之间进行映射。

映射完成后，可以通过物理地址B(处于MMIO) 访问 PCI设备，访问是会通过 PCI桥对地址进行翻译。

驱动通过 ioremap 把物理地址B 映射成虚拟地址C

通过虚拟地址C 访问 PCI总线地址A

e1b622234d13

MMIO访问

2. PCI总线访问内存

假设 PCI设备支持 DMA，那么在传输数据的时候，我们需要一块 DMA buffer 用于接收或者发送数据，这块 DMA buffer 存在于 RAM内存区域中。但我们之前说了，PCI 在 MMIO区域有规定的总线地址，那么在 RAM内存区域也是一样，PCI设备无法通过方位 RAM内存区域中的虚拟地址来获取或存放数据。但与 MMIO 不同的是，MMIO 通过 PCI桥将虚拟地址映射为总线地址，RAM内存则是通过 IOMMU 将虚拟地址映射为总线地址。

上面说的 IOMMU 与 MMU 的工作机理类似，但不同的是 MMU 是映射物理地址到虚拟地址，IOMMU 是映射总线地址到物理地址。

那么 PCI设备、DMA 和 CPU 是如何在同一块内存中进行交互的呢？

回答这个问题，我们需要清楚以下几点：

PCI设备使用 DMA 传输的是数据时需要使用的是总线地址，即 DMA 是使用总线地址作为源地址或者目的地址

DMA 传输数据时，*IOMMU 可以将总线地址转换物理地址。

DMA 传输完成后，CPU 使用虚拟地址访问该内存块。

其步骤如下：

内存块由 CPU 创建，此时 CPU 获取到的是内存块的虚拟地址X。

调用接口，将该内存块的虚拟地址X 对应的物理地址Y 映射为总线地址Z 并返回给 CPU。

CPU 拿到的地址有内存块的虚拟地址和总线地址，其物理地址对于 CPU 来说没有意义。

将总线地址写入 DMA 对应的寄存器，接着就可以执行相关的 DMA操作了。

e1b622234d13

内存访问

PS：注意如果DMA的工作不是在PCI这种有规范的设备上，那么总线地址可以认为是普通内存地址

2.3 IOMMU

上面粗略讲了 IOMMU 在 DMA 工作过程中的应用，但其实 IOMMU 的用处不止这些，下面简单地描述 IOMMI 的另外一个作用。

我们都知道，在带有 MMU 的 Soc 上，对于程序来说，虚拟地址空间是可连续访问的。

因为 MMU 帮我们完成了从虚拟地址空间到物理地址空间的映射，这样做固然对于程序来说可以大大提高内存管理的效率，但同时也带来了物理内存空间碎片化的结果，找到可连续访问的物理地址空间的难度将大大增加。

而当 Soc 上的设备使用 DMA 访问内存时，需要可连续访问的物理地址空间。

一般情况下，有 2 种办法可以让 DMA 访问连续的物理地址空间：

在初始化内核时，将一部分物理空间保留下来，不进行虚拟空间的映射。当使用到 DMA 的时候，将所需要的数据放置到内存空间。再让DMA去访问这段物理内存。这种方法简单直接，但会使得内存空间的使用率并不高。

DMA 带上 MMU，让其在访问虚拟空间时自动完成虚拟地址到物理地址的映射，此时 DMA 可以在不保留连续物理地址空间的情况下访问连续的虚拟空间。

ARM 使用了第二种方法，增加了一个特殊的 MMU，即 IOMMU。IOMMU 在 ARM架构中称为 SMMU。SMMU 和 MMU 一样，在配置后可以进行 translation table walk。

总结 IOMMU 的 2 个用处：

映射总线地址到物理地址

提高物理内存的使用率

2.4 DMA控制器硬件

2.4.1 DMA寄存器

按照笔者理解，DMA控制器一般都会包含以下寄存器：

DMA硬件描述符地址寄存器：存放 DMA描述符的地址。

DMA配置寄存器：配置 DMA 的 burst 、 width 、传输方向等属性。

DMA使能寄存器：使能 DMA通道

DMA中断状态寄存器：获取 DMA 传输中断状态

DMA中断使能寄存器：使能 DMA 通道中断

2.4.2 DMA描述符

DMA控制器在工作时需要读取 DMA描述符，这个描述符如下图所示：

e1b622234d13

image.png

一般情况下，它一共包含以下信息：

src_addr：DMA源地址

dst_addr：DMA目的地址

byte_count：传输数量

link：下一个描述符地址，如果为最后一个描述符则该值为某一个特定的值。

PS：上面的信息是指在一般情况，有些厂家会根据需要调整包含信息的内容。

需要使用 DMA控制器进行传输时，我们需要在开辟一块内存，这块内存存放的就是 DMA描述符。当 DMA控制器进行工作时，需要程序将 DMA描述符的地址设置到 DMA硬件描述符地址寄存器中。这样，当使能 DMA控制器开始工作后，会读取 DMA硬件描述符地址寄存器中的内存地址并读取相应的 DMA描述符，根据 DMA描述符的所描述的地址跟大小进行传输。当完成一个 DMA描述符的传输后会根据情况读取下一个 DMA描述符。

2.4.3 LLI

上面说过驱动会创建内存块用于存放 DMA描述符，这些内存块我们称之为 LLI。LLI 全称为 Link List Item，一般在驱动代码中都可以看到其结构体。以笔者的学习代码，其代码如下，可以看到有几个成员与图中所描绘的一致：

* Hardware representation of the LLI

* The hardware will be fed the physical address of this structure,

* and read its content in order to start the transfer.

struct sun6i_dma_lli {

u32 cfg;

u32 src;

u32 dst;

u32 len;

u32 para;

u32 p_lli_next;

* This field is not used by the DMA controller, but will be

* used by the CPU to go through the list (mostly for dumping

* or freeing it).

struct sun6i_dma_lli *v_lli_next;

};

2.4.4 DMA request

一般情况下，当外设驱动准备好传输数据及任务配置后，需要向 DMA控制器发送 DRQ信号(DMA request)。所以需要有物理线连接 DMA控制器和外设，这条物理线称为 DMA request line。。发送这个信号往往是向 DMA配置寄存器中写入 DRQ值。每种外设驱动都有自己的 DRQ值，当启动 DMA传输后，会查询 DRQ值，如果当前的 DRQ值能够进行传输，则启动 DMA传输。

有时 DMA request (line) 又称为 DMA port。

2.4.5 DMA通道

DMA控制器可以同时进行的传输个数是有限的，每一个传输都需要使用到 DMA物理通道。DMA物理通道的数量决定了 DMA控制器能够同时传输的任务量。

在软件上，DMA控制器会为外设分配一个 DMA虚拟通道，这个虚拟通道是根据 DMA request信号来区分。

通常来讲，DMA物理通道是 DMA控制器提供的服务，外设通过申请 DMA通道，如果申请成功将返回 DMA虚拟通道，该 DMA虚拟通道绑定了一个 DMA物理通道。这样 DMA控制器为外设提供了 DMA服务，当外设需要传输数据时，对虚拟通道进行操作即可，但本质上的工作由物理通道来完成。

看完了这些以后，对于 DMA硬件及其工作流程都应该有了一定的了解。

2.5 DMA驱动讲解

2.5.1 DMA设备树

下面 2 段设备树代码例程是关于 DMA控制器和 DMA客户端的

/* DMA控制器设备树节点 */

dma: dma-controller@01c02000 {

compatible = "allwinner,sun8i-v3s-dma";

reg = <0x01c02000 0x1000>;

interrupts = ;

clocks = ;

resets = ;

#dma-cells = <1>;

};

/* DMA客户端设备树节点，以SPI为例 */

spi2: spi@01c6a000 {

compatible = "allwinner,sun6i-a31-spi";

reg = <0x01c6a000 0x1000>;

interrupts = <0 67 4>;

clocks = , ;

clock-names = "ahb", "mod";

dmas = , ;

dma-names = "rx", "tx";

resets = ;

};

DMA控制器的设备树节点属性我们这里不多讲，有兴趣的读者可以阅读内核文档。

DMA客户端我们主要关注下面 2 个属性：

dmas：该属性一共有 2 个，第一个 DMA控制器的节点名，第二个为该驱动的 DMA port

dma-names：该属性用于 dma_request_chan 接口，传入该接口的参数中的 name参数需要与设备树中的 dma-names 一致，这样才能申请到 DMA通道

PS：DMA port 在每个Soc的datasheet中有说明，使用DMA时需要将DMA port设置到DMA配置寄存器中。DMA port一般如下图所示：

e1b622234d13

image.png

更多详情可以在文档 Documentation/devicetree/bindings/dma/dma.txt 中查看

2.5.2 dmaengine框架

在驱动中，有多种使用 DMA 的方式及接口框架，本文将重点说明 dmaengine框架的代码及使用。下面按照使用流程进行描述。

重要事情说三遍：

各个平台的实现可能有所不同，代码过程仅供参考，重在学习流程及机制，下面将按照笔者手中的学习代码为例!!!!

各个平台的实现可能有所不同，代码过程仅供参考࿰

最低0.47元/天解锁文章

刘 jin

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
linux io使用dma传输,linux驱动之DMA

一、前言在嵌入式Linux 的内核及驱动中，DMA 常常被人提起。我们也许清楚它的原理且很明白它非常重要，但在某种程度上，对于 DMA 的使用者来说，我们一般使用其接口，而很少去了解整个 DMA 的运作方式。那么本文就从头到尾，简单地说一下 DMA 吧注意：本文对DMA的概念不做讲述，请各位读者自行了解DMA的概念。二、正文2.1 高端内存2.1.1 内核虚拟内存在了解 DMA 之前，我们需要先...
复制链接

扫一扫