Vitis AI 引擎系列
文章平均质量分 90
芯语芯愿
这个作者很懒,什么都没留下…
展开
-
AI 引擎系列 8 - 运行时比率参数简介
在本文中,我们将讲解该参数如何影响 AI引擎应用的资源使用率和性能。原创 2023-12-25 20:43:53 · 160 阅读 · 0 评论 -
AI 引擎系列 7 - 在仿真内通过追踪来可视化 AI 引擎事件(2022.1 更新)
在本文中,我们将讲解如何生成追踪来观察计算图 (graph) 的状态,这也是执行性能分析的关键要素。原创 2023-12-25 20:42:39 · 111 阅读 · 0 评论 -
AI 引擎系列 6 - 在 Vitis 分析器中分析 AI 引擎编译结果(2022.1 更新)
位于计算图与第一个内核的输入端口之间的存储器缓冲器以及位于第二个内核与计算图的输出端口之间的存储器缓冲器均为双缓冲器,每个此类存储器都有 2 个名称(例如,buf0 和 buf0d),这是此类缓冲器的识别依据。第一个内核读取存储器缓冲器,第二个内核则写入存储器缓冲器,这些内核与其读写的存储器缓冲器都位于相同拼块上。用于在 2 个内核之间进行通信的缓冲器位于相邻的 tile [24,1] 拼块上,因此这些内核可以直接访问该缓冲器,而无需任何 DMA,也没有额外时延(相比于读取位于相同拼块上的存储器)。原创 2023-11-20 20:10:14 · 114 阅读 · 0 评论 -
AI 引擎系列 5 - 以 AI 引擎模型为目标运行 AI 引擎编译器(2022.1 更新)
引擎系列 5 - 以 AI 引擎模型为目标运行 AI 引擎编译器(2022.1 更新)我们将在后续博文中详细分析此文件。中所述),此代码并未最优化为在矢量处理器上运行,因此并未充分发挥其算力。在弹出窗口中,单击列表图标(预定义的筛选器)。这样将会从仿真器的输出文件中移除时间戳,仅对输出样本值进行比较。在后续博文中,我们将讲解出现此时延的各种原因,但请谨记(正如。引擎仿真属于周期近似仿真,因此输出文件包含数据的时间戳。这样即可在控制台中看到该命令的运行过程。现在我们可以验证,输出的数据与黄金结果仍然匹配。原创 2023-11-11 10:17:52 · 97 阅读 · 0 评论 -
AI 引擎系列 4 - 首次运行 AI 引擎编译器和 x86simulator(2022.1 更新)
完成构建后,即可在“Explorer”(资源管理器)窗口中看到,编译器已生成名为“Emulation-SW”的文件夹,并且编译输出包含在“Work”目录中。选中“AI Engine Application”(simple_application),然后单击“Run As”图标旁的箭头,单击“Run As > Launch SW Emulator”(运行方式 > 启动软件仿真器)Emulation-AIE(AI 引擎仿真):为 AI 引擎执行编译。Hardware(硬件):为硬件目标执行编译。原创 2023-11-04 11:21:50 · 144 阅读 · 0 评论 -
AI 引擎系列 3 - AI 引擎内核简介
但由于存储器可用作为乒乓缓冲器,内核执行期间下一组数据可以写入存储器中,并准备就绪以供下一次迭代使用。使用串流时,如果下游内核无法快速处理数据,就可能对上游内核产生反压,但如果上游内核生成数据的速度不够快,那么也可能造成下游内核中出现停滞。输出样本的值包含实数部分和虚数部分,其中实数部分是输入样本的实数部分和虚数部分之和,虚数部分则是输入样本的实数部分和虚数部分之差。内部函数(专用于处理矢量处理器的函数),因此仅在标量单元上运行,并且不会利用矢量处理单元。中提到过,该值是在计算图中设置的,用于连接内核。翻译 2023-10-27 18:39:11 · 78 阅读 · 0 评论