GPU-IO板调试记录

newton64

已于 2024-02-27 18:24:36 修改

阅读量341

点赞数 1

分类专栏： GPU实时计算-FPGA设计文章标签： fpga

于 2024-01-30 19:42:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/newton64/article/details/135940063

版权

GPU实时计算-FPGA设计专栏收录该内容

4 篇文章 1 订阅

订阅专栏

文章记录了在使用Datagen发送数据并整合到DDR的过程中，开发者遇到的一系列问题，如ILA下载失败、.dat文件更新无效、PLl配置错误、Vivado编译错误等。通过逐步排查和调整，包括PLL连接方式、MIG配置、时钟频率等，最终解决了这些问题并优化了设计过程。

摘要由CSDN通过智能技术生成

目录

使用data gen发送的数据目前可以写入ddr

1.遇到一次下载找不到ILA：

2.更新.dat文件无效，readmemb仿真正常，上板总为旧值

1.place报错Sub-optimal.....

2.重新设置后生成MIG IP报错：the nested sub-design....

3.GTH和GTX文件差别

1.vivado BD 报错 FREQ_HZ does not match

2.疑似AGX过来的V7 PCIE时钟没有

1.linux和windows vivado编译速度比较

2.ubuntu下vivado安装驱动后认不出JTAG

3.PCIE不识别：调试

4.添加多个MIG后报地址32位不匹配错误

5.DDR16G：调试

1.unroutable placement error

1.badly-structured..... cannot be decrypted

2.烧写V7报错

2024.1.30

使用data gen发送的数据目前可以写入ddr

2024.1.31

1.遇到一次下载找不到ILA：

重新下载依旧，重新上电IO板后正常。

2.更新.dat文件无效，readmemb仿真正常，上板总为旧值

怀疑是因为.dat文件名没变，没有重新综合这块，更改文件名再试 ->

仍然不行

无奈换成coe实现，使用分布式rom，正常：

2024.2.1

1.place报错Sub-optimal.....

按照提示，可以：

2.重新设置后生成MIG IP报错：the nested sub-design....

reset 整个BD的output之后，可以生成IP不报错。删掉了入口的PLL，使MIG直接与外部晶振连接。之后重启电脑(电脑的问题)后正常生产bit文件。

3.GTH和GTX文件差别

移植时除了重新新建wizard IP核以外，还要换example design的support文件夹下的common文件。

4.PLL报错

报错内容：[DRC REQP-1712] Input clock driver: Unsupported PLLE2_ADV connectivity. The signal U_gpu_power/u_clk/inst/clk_in1 on the U_gpu_power/u_clk/inst/plle2_adv_inst/CLKIN1 pin of U_gpu_power/u_clk/inst/plle2_adv_inst with COMPENSATION mode ZHOLD must be driven by a clock capable IO.

原因：PLL中输入时钟为差分转单端，PLL clkin需要选为Global buffer。

2024.2.5

1.vivado BD 报错 FREQ_HZ does not match

这里报的是port的频率不匹配，所以把clk的port属性中的频率改为一致（原来是100M改为125M）就好了。

2.疑似AGX过来的V7 PCIE时钟没有

用该时钟的ILA触发时显示：

2024.2.6

1.linux和windows vivado编译速度比较

windows：

linux:

同样的工程，linux比windows快了大约一倍。

2.ubuntu下vivado安装驱动后认不出JTAG

关闭vivado拔出JTAG再安装就好了

3.PCIE不识别：调试

去掉了tx的约束，从IO plainning中看到其实会自动分配，只要约束时钟就行了。仍然不识别

观察pcie_rst信号，有，当GPUrebind时会复位。

观察clkreq，为低，正常。

考虑之前pcie ref clk为100M的时候，看的一直是AGX1（实际上应该看AGX2）。等到知道看AGX2时时钟改为了125MHz。尝试将125改回100。

改回100MHz就好了。

4.添加多个MIG后报地址32位不匹配错误

添加多个MIG后AXI地址自动变为64位，并且可以在address editor里设置超过4G的MIG地址。

相应的也需要设置其它访问MIG的地址：

将uiFDMA的地址设置成和下面一样之后，错误消失。

5.DDR16G：调试

访问第一组DDR4G：

读也正常：

读时burst长度为32，每次64Byte，一次正常2048Byte。

访问第二组DDR4G：

读数也正确：

2024.2.7

1.unroutable placement error

当我把IO板的DDR从2个增加为4个时，报错：

这篇提到了这个问题，但没有解决：AMD Customer Community

（另外这个帖子提到了他在txoutclk后面加了BUFG，这显然也是一个解决方法，但是怎么在IP核内部的信号上加BUFG呢？：AMD Customer Community）

其中提到了一个看clock region的方法：

get_property CLOCK_REGION [get_sites GTXE2_CHANNEL_X0Y4 ]

于是我查看错误信息里的两个模块，确实不在同一个时钟区域：

可以看到X1Y2是我PCIE的clk pin所在的时钟区域：

而这个区域的两个MMCM（白色高亮）都被DDR占用了（DDR有C0C1C2C3四组，其中C2也在这个区域）：

尝试使X1Y2的一个MMCM unplace，然后把XDMA的MMCM拖过来：

*MMCM的路径是通过报错里的路径知道的：isnt_BD_Top/xdma_0/inst/pcie3_ip_i/inst/gt_top_i/pipe_wrapper_i/pipe_clock_int.pipe_clock_i/mmcm_i (MMCME2_ADV.CLKIN1)，按照这个路径可以在综合后的netlist找到这个模块。

保存之后自动在xdc添加了约束：

这样之后在place的阶段确实不再报错了。但是DDR离远了没关系吗？

之后在write_bitstream阶段报错如下这条约束，说并没有走backbone：

于是屏蔽这条约束重新编译。

又报了之前的错：unroutable placement error，仍然说XDMA的GT和MMCM的问题。

打开综合可以看到warning：

最后暂时用报错建议的方法，走次优路线，先规避错误。编译成功。

测试，第1/3/4片DDR访问正常：

第二片DDR访问会卡死，看ILA AW一直不ready。

查ucf发现第二片的odt写错了，改正后重新编译。

测试，第二片好了，第一片又不行了，三四片仍然好。

看时序报告，MIG的第一片DDR部分有时序违例：

大概是DDR资源用多了之后，200MHz的时钟太快了，需求5ns但是只能到7.5ns，由此看如果是100MHz的10ns肯定可以满足。

于是将MIG的4个DDR频率改为400MHz，仍然4:1，用户时钟则变为100MHz。

布线后的时序报告可以看到只剩ILA的违例了：

上板测试，4个DDR都可以正常访问：

写DDR

读DDR

2024.2.22

1.badly-structured..... cannot be decrypted

在增加了一些ILA后，之前一个用的好好的ILA报错badly-structured....，reset ILA或者将其它的也改成global都无济于事，暂时删除，编译通过。很奇怪。

2.烧写V7报错

重启电脑之后不报这个错了，但仍然不加载ILA，说XDMA的ILA没认出来，可能是GPU那边没给时钟，先去掉这个ILA。

之后又报MIG的ILA：

实际上删ILA没用，会一直报，只要把AURORA的ILA删了就不报了，怀疑是128位太宽了。最终精简成：

可以跑起ILA。（但第一次烧录时还是报错了，refresh一下就出来了）

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
GPU-IO板调试记录

使用data gen发送的数据目前可以写入ddr。
复制链接

扫一扫

专栏目录

newton64 CSDN认证博客专家 CSDN认证企业博客

码龄12年

8: 原创

61万+: 周排名

19万+: 总排名

2179: 访问

: 等级

105: 积分

14: 粉丝

14: 获赞

4: 评论

3: 收藏

私信

关注

热门文章

分类专栏

SMU重写 2篇
GPU实时计算-FPGA设计 4篇

最新评论

SMU架构修改
CSDN-Ada助手: 恭喜您对SMU架构进行了修改，这对于提升系统性能和稳定性是非常重要的一步。希望您能继续分享关于架构修改的心得体会，或者可以考虑深入探讨一些具体的技术细节，让我们更好地理解您的思路和方法。期待您的下一篇文章！
s_axi_lite_interface
CSDN-Ada助手: 恭喜您写了第7篇博客“s_axi_lite_interface”！不断分享知识真的很棒！希望您能继续保持创作的热情，也建议您可以尝试写一些与工程技术相关的实践经验分享，或者是对行业发展的前瞻性分析，这样能够吸引更多读者的关注。期待您的下一篇作品！祝您一切顺利！
AURORA接口调试
CSDN-Ada助手: 恭喜您发布了新的博客《AURORA接口调试》，看来您对技术领域的研究和实践越发深入了。希望您能继续保持创作的热情，分享更多有趣的内容给大家。或许下一步可以考虑写一些关于AURORA接口优化或者应用实例方面的文章，让读者更深入地了解这方面的知识。期待您的精彩继续！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
vscode导致win10蓝屏
CSDN-Ada助手: 恭喜你开始了博客创作！对于vscode导致win10蓝屏的问题，你的经验分享对很多人都会有所帮助。接下来，建议你可以继续分享一些解决该问题的方法或者其他常见的技术问题，让读者能够从你的博客中获得更多实用的信息。希望你能够继续保持分享的热情，不断提升自己的写作水平，期待你未来更多精彩的博客内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
vivado布局报错
CSDN-Ada助手: 非常高兴看到你写了第二篇博客！你对于解决vivado布局报错的问题给出了简洁明了的解决方案，这对其他遇到同样问题的读者来说非常有用。除了你提到的重启电脑和reset implementation，还有一些与vivado布局报错相关的扩展知识和技能可以进一步探索。例如，你可以深入了解vivado的布局算法和原理，以便更好地理解报错的原因和解决方案。此外，你还可以研究一些优化布局的技巧，如使用约束和引入时序分析。当然，这些扩展知识和技能可能需要更多的时间和实践来掌握。但是，你已经在第二篇博客中展现了很好的技术能力和解决问题的能力，我相信你一定能够继续努力并取得更进一步的成长。请继续分享你的学习经验和技术心得，相信你的博客会对其他人有很大的帮助！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。