信息来进行后续的技术说明。博主现在是在牙膏厂里,部分技术和细节不方便讨论,仅就公开资料和网上可以获取的
回到我们问题上来,为什么是CXL。
1. GPU和CPU 数据交互
简单例子,我们只关心GPU和CPU之间的数据交互是什么样的。
这里可以看到:
CPU有多个core, 这里举例两个;
Core和Cache连接起来, ring形状的内部总线是传统连接的一种方式,现在有更多的方式,比如Mesh总线连接。
CPU 处理结束数据,数据从CPU->Cach->Memory,如果数据要送给插在PCIe卡槽上的GPU处理,可能还需要送到Nvmem或者其它的Storage.
然后通过PCIe的通道,送到GPU里面,GPU 内部会把数据送到GPU-memory 里,然后送到GPU-DATA Cache. GPU的计算UNIT 会获取到数据,送给不同的Thread去计算处理。
这里看到了吗,如果CPU 处理好的数据暂存在CPU-Cache里,如果能直接通过PCIe或者送到其它通道,送到GPU-Cache,是不是省去了很多中间过程。
或者多点中间处理过程,CPU-Memory 数据直接通过PCIe送到GPU-Memory呢?
传统处理上可能不需要这样的快速通道