NUMA 特性
理解:
1、load/store 是指令,用于寄存器和内存间数据的传送,latency 是反映这个指令需要多少个 cycle 来完成
load 把内存中数据装载到寄存器中,store 把寄存器数据存入内存。
2、该集合指令使用频繁,因为其他指令只能操作寄存器,当数据存放在内存中时,必须先把数据从内存装载到寄存器,执行完后再把寄存器中的数据存储到内存中。
因此可以说,该集合指令在NUMA的本地node上执行,很重要!
3、注意区分三级存储
存储速度由高到低:寄存器 Register –>高速缓存 cache(一级/二级)–> 内存
4、带宽,NUMA的带宽分别是:本地顺序 > 远程顺序 > 本地随机 > 远程随机
因此,系统设计时要尽量避免远程随机访问。
Polymer中为了消除远程随机访问,采用了 agent 的概念,后面会有介绍说明。
Graph-aware partitioning
理解:
1、划分:度划分,例如此处就是根据每个点的入度来划分。