zynq7015,PCIE读写延时偏大

🏆本文收录于《全栈Bug调优(实战版)》专栏,主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!

问题描述

读写数据量不大,尤其是写。但是对实时性要求比较高。
win10/11,xilinx的ZYNQ7015的开发板,XDMA的驱动,H2C0写,C2H0读,小数据量读写,每次读或者写都要差不多70us(写一般只有几十个字节,读固定4096字节,重复256次,取平均时间)。增加数据长度的话时间延长不大。时间是用std::chrono来测量的,逻辑分析仪上抓波形得到的时间也基本与此一致。
用user进行几十个字节的数据量的写,似乎写的时间可以大幅降低。DMA反而比user还慢?
从这两点上来看,似乎时间不是消耗在了数据传输上。这个也不像TCPIP那样需要几次握手什么的,感觉纯粹就是准备DMA的过程消耗了比较多的时间。
以写为例,驱动这边(代码就不贴了,只说大概流程)EvtIoWriteDma这里,GetQueueContext,WdfDmaTransactionInitializeUsingRequest之后就是WdfRequestMarkCancelableEx这几个函数准备DMA,紧接着就WdfDmaTransactionExecute,EnginePollTransfer传输数据。
不知道这种现象算不算正常,有没有改善的思路?

解决方案

  如下是上述问题的解决方案,仅供参考:

  在使用 Xilinx ZYNQ7015 开发板进行 PCIe 数据传输时,如果发现 DMA 读写延时偏大,这可能与多个因素有关。以下是一些可能的原因和改善思路:

  1. DMA 引擎配置:检查 DMA 引擎的配置是否最优化。例如,DMA 传输的 burst size、transfer width 等参数可能影响传输效率。尝试调整这些参数,看是否能减少延时。

  2. 驱动程序优化:分析驱动程序代码,查看是否有不必要的延迟或等待。例如,检查是否有可以并行处理的操作被串行化执行,或者是否有可以优化的锁机制。

  3. 中断处理:如果使用了中断来通知 DMA 传输完成,检查中断服务例程(ISR)是否高效。ISR 应该尽可能快地执行,以减少对 DMA 传输的影响。

  4. 缓存一致性:确保 CPU 和 FPGA 之间的缓存一致性得到妥善处理。缓存不一致可能导致额外的同步开销。

  5. 数据对齐:检查传输数据是否对齐。未对齐的数据可能会导致额外的处理开销。

  6. PCIe 链路和信用基础架构:检查 PCIe 链路是否配置正确,包括链路宽度、信用基础架构等。这些配置不当可能会导致链路效率低下。

  7. DMA 队列深度:如果 DMA 引擎支持队列,检查队列深度是否适当。过深的队列可能会导致延迟增加。

  8. 操作系统调度:操作系统对 DMA 传输的调度也会影响延时。检查是否有操作系统级别的优化可以应用。

  9. 硬件设计:检查 FPGA 的硬件设计,确保没有不必要的信号延迟或瓶颈。

  10. 驱动和硬件的同步:确保驱动程序和硬件之间的同步机制是高效的。例如,使用适当的 DMA 完成标志和状态寄存器。

  11. 使用更高效的数据传输路径:如果可能,考虑使用更高效的数据传输路径,比如直接内存访问(DMA)而不是用户空间的读写。

  12. 性能分析工具:使用性能分析工具(如 PCIe 性能分析器)来确定延时的具体来源。

  13. 更新驱动和固件:确保使用的是最新的驱动程序和 FPGA 固件,因为新版本可能包含性能改进。

  14. 减少上下文切换:尽量减少 DMA 传输过程中的上下文切换,这可能会引入额外的延迟。

  15. 代码优化:使用 std::chrono 测量时间是一个好的开始,但也要确保代码中没有其他潜在的性能瓶颈。

最后,如果 DMA 的性能仍然不满足要求,可以考虑使用更高性能的接口或者优化现有的硬件设计。在某些情况下,可能需要在 FPGA 上实现更高效的数据处理逻辑,以减少对 DMA 的依赖。

  希望如上措施及解决方案能够帮到有需要的你。

  PS:如若遇到采纳如下方案还是未解决的同学,希望不要抱怨&&急躁,毕竟影响因素众多,我写出来也是希望能够尽最大努力帮助到同类似问题的小伙伴,即把你未解决或者产生新Bug黏贴在评论区,我们大家一起来努力,一起帮你看看,可以不咯。

  若有对当前Bug有与如下提供的方法不一致,有个不情之请,希望你能把你的新思路或新方法分享到评论区,一起学习,目的就是帮助更多所需要的同学,正所谓「赠人玫瑰,手留余香」。

☀️写在最后

  如上问题有的来自我自身项目开发,有的收集网站,有的来自读者…如有侵权,立马删除。再者,针对此专栏中部分问题及其问题的解答思路或步骤等,存在少部分搜集于全网社区及人工智能问答等渠道,若最后实在是没能帮助到你,还望见谅!并非所有的解答都能解决每个人的问题,在此希望屏幕前的你能够给予宝贵的理解,而不是立刻指责或者抱怨!如果你有更优解,那建议你出教程写方案,一同学习!共同进步。

  ok,以上就是我这期的Bug修复内容啦,如果还想查找更多解决方案,你可以看看我专门收集Bug及提供解决方案的专栏《CSDN问答解惑-专业版》,都是实战中碰到的Bug,希望对你有所帮助。到此,咱们下期拜拜。

码字不易,如果这篇文章对你有所帮助,帮忙给 bug菌 来个一键三连(关注、点赞、收藏) ,您的支持就是我坚持写作分享知识点传播技术的最大动力。

同时也推荐大家关注我的硬核公众号:「猿圈奇妙屋」 ;以第一手学习bug菌的首发干货,不仅能学习更多技术硬货,还可白嫖最新BAT大厂面试真题、4000G Pdf技术书籍、万份简历/PPT模板、技术文章Markdown文档等海量资料,你想要的我都有!

📣关于我

我是bug菌,CSDN | 掘金 | InfoQ | 51CTO | 华为云 | 阿里云 | 腾讯云 等社区博客专家,C站博客之星Top30,华为云2023年度十佳博主,掘金多年度人气作者Top40,掘金等各大社区平台签约作者,51CTO年度博主Top12,掘金/InfoQ/51CTO等社区优质创作者;全网粉丝合计 30w+;硬核微信公众号「猿圈奇妙屋」,欢迎你的加入!免费白嫖最新BAT互联网公司面试真题、4000G PDF电子书籍、简历模板等海量资料,你想要的我都有,关键是你不来拿哇。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bug菌¹

你的鼓励将是我创作的最大动力。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值