【Cache篇】DMA和Cache的一致性

漫游嵌入式

已于 2022-05-05 13:52:16 修改

阅读量3.8k

点赞数 5

分类专栏：《ARMv8架构初学者指南》文章标签：缓存 ARMv8 cache

于 2022-05-02 15:39:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38131812/article/details/124541744

版权

《ARMv8架构初学者指南》专栏收录该内容

23 篇文章

订阅专栏

🌟🌟🌟博主主页：MuggleZero 🌟🌟🌟

《ARMv8架构初学者笔记》专栏地址：《ARMv8架构初学者笔记》

前文：

【Cache篇】初见Cache

【Cache篇】Cache的映射方式

【Cache篇】包容性和排他性的Cache

【Cache篇】Cache的分类

【Cache篇】MESI协议

【Cache篇】Cache伪共享

DMA（Direct Memory Access）直接内存访问，它在传输过程中是不需要CPU干预的，可以直接从内存中读写数据。CPU要搬移数据的话，假设是从内存A搬移到内存B，它首先要从内存A中把数据搬移到通用寄存器里，然后从通用寄存器里把数据搬移到内存B，此外，CPU搬移的过程中有可能被别的事情打断。而DMA就是专职搬移内存的，它可以操作总线，直接从内存A搬移数据到内存B，只要DMA开始干活了，就没有人来打扰它了，所以DMA效率上比CPU搬移要快。要使用DMA，在DMA开始干活之前，需要CPU配置DMA怎么搬移数据，从哪里搬到哪里。

但是有的时候我们会发现使用DMA获得的数据和cache中的数据不一致。出现这个问题的原因主要有两个：

DMA直接操作系统总线来读写内存地址，而CPU并不感知。
DMA修改的内存地址，在CPU的cache中有缓存，但是CPU并不知道内存数据被修改了，CPU依然去访问cache的旧数据，导致Cache一致性问题。

DMA和cache一致性的解决

第一种方案是使用硬件cache一致性的方案，需要SOC中CCI这种IP的支持。
第二种方案就是使用non-cacheable的内存来进行DMA传输，这种方案最简单但效率最低，严重降低性能，还增加功耗。
第三种使用软件主动干预的方法来帮助cache一致性。这个是比较常规的方法，特别是在类似CCI这种缓存一致性控制器没有出来之前，都用这种方式。

对于DMA的操作，我们需要考虑以下两种情况。

从内存到设备FIFO

传输路径：内存->设备FIFO （设备例如网卡，通过DMA读取内存数据到设备FIFO）

这种场景下，通常都是CPU的软件来产生了新的数据，然后通过DMA数据搬到设备的FIFO里。这里类似的网卡设备的发包过程。

在DMA传输之前，CPU的cache可能缓存了内存数据，需要调用cache clean/flush操作，把cache内容写入到内存中。因为CPU cache里可能缓存了最新的数据，然后再启动DMA传输数据，把DMA buffer的数据传输到设备的FIFO。

在DMA传数据之前，先做cache的clean或者flush操作是一个非常关键的点。

例如上面的图中，最新的数据其实是在cache里。因为CPU创建一个新的数据后必定是先到cache，然后再传递给DMA buffer。因此在启动DMA传输之前，必须要先clean/flush cache，把cache的数据回写到DMA buffer里。

从设备FIFO到内存

传输路径：设备FIFO -> 内存（设备把数据写入到内存中）

设备的FIFO产生了新数据，需要把数据写入到DMA buffer里，然后CPU就可以读到设备的数据，类似网卡的收包的过程。

在DMA传输之前，最新的数据是在设备的FIFO里，此时cache里的数据就是旧的无效数据，我们要先将其invalid，然后再启动DMA传输。

在启动DMA之前，最新的数据源在哪里？是在CPU那侧还是设备那侧？
在启动DMA之前，cache保存的数据是最新的还是过时的？

显然，CPU侧产生新数据时需要Flush cache，CPU侧获取新数据时需要Invalid cache。

欢迎关注我的个人微信公众号，一起交流学习嵌入式开发知识！

关注「求密勒实验室」

漫游嵌入式

博客等级

码龄8年

嵌入式领域优质创作者

博客专家认证

209
原创

369
点赞

1856
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

Uboot启动分析--start.S启动分析（1）
wdfk_prog: pie_fix_loop在修复开始的代码段地址可能存在_start的地址并不是R_AARCH64_RELATIVE的,所以需要遍历读取到该类型进行指定TEXT_BASE https://blog.csdn.net/yeholmes/article/details/120122498
Uboot链接脚本分析（ARMv8架构）
wdfk_prog: 最新代码中删除了 [code=csharp] char __image_copy_start[0] __attribute__((section(".__image_copy_start"))); [/code] 使用完成了同样的操作 [code=csharp] __image_copy_start = ADDR(.text); [/code]
Uboot链接脚本分析（ARMv8架构）
wdfk_prog: [code=plain] - `IMAGE_TEXT_BASE`和`IMAGE_MAX_SIZE`在`Makefile.spl`中定义为`CONFIG_SPL_TEXT_BASE`和`CONFIG_SPL_MAX_SIZE`，这两个变量在`Konfig`中配置 - `CONFIG_$(SPL_TPL_)` 是一个 Makefile 变量，它的值取决于 SPL_TPL_ 变量的值。 `CONFIG_` 是一个前缀，通常用于表示配置选项。`$(SPL_TPL_)` 是一个变量，它的值可以是`空字符串、SPL_ 或 TPL`_，具体取决于编译的阶段（SPL或 TPL）。例如，如果 SPL_TPL_ 的值是 SPL_，那么 `CONFIG_$(SPL_TPL_) 就会变成 CONFIG_SPL_。如果 SPL_TPL_ 的值是 TPL_，那么 CONFIG_$(SPL_TPL_) `就会变成 CONFIG_TPL_。如果 SPL_TPL_ 是空字符串，那么 CONFIG_$(SPL_TPL_) 就会变成 CONFIG_。这个机制允许在不同的编译阶段使用不同的配置选项。例如，在编译 SPL 阶段时，可以使用 CONFIG_SPL_TEXT_BASE，而在编译 TPL 阶段时，可以使用 CONFIG_TPL_TEXT_BASE。 [/code]
Linux内核进程调度发生的时间点
南征北战zZZ: 是的，硬件定时器会定期触发检查是否需要调度
【DRM】DRM bridge驱动调用流程简单分析
qq_27880005: 这个应该是一个虚拟的fb设备吧？是drm模拟出来的

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

漫游嵌入式 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。