IEEE Computer Architecture Letters 2023 Paper CXL论文阅读汇总
问题
CXL接口是一种最新的技术,通过在配置异构设备时提供内存共享协议,实现了有效的内存扩展。然而,它有限的物理带宽可能是新兴数据密集型应用的一个重要瓶颈。
本文方法
我们提出了一种基于CXL的分离式内存架构:在CXL内存内部设计了一个近数据计算核心,减少通过CXL接口的数据移动;提出了一种负载均衡器,通过有效地交织内存通道,并利用性能优化的MAC运算器隐藏累加器延迟,充分利用内部带宽。
实验结果表明,我们的设计在性能/功耗效率方面比现有的CPU系统提高了高达1.9倍。
实验
使用Xilinx Alveo U250 FPGA和四通道DDR内存(DDR4/2400Mbps/128GB)对CMS卡进行了原型设计。
实验对比:执行时间、通道性能、功率
总结
通过CXL利用分离式内存加速应用计算。在CXL内存设计了计算核心,减少通过CXL传输的数据量;通过交织内存通道,利用MAC运算器隐藏累加器延迟,充分利用内部带宽。