NUMA互联技术1

1.      Numascale公司的互联技术

 

Numascale的 Numa互联技术使得计算机系统供应商可以用集群水平的成本来构建可扩展的服务器,而功能却达到企业大型机的水平。此技术将所有的处理器,内存和IO资源,在一个完全虚拟化的环境中统一进行管理,管理的操作系统可以是Windows,Linux,Solaris或其它Unix的衍生系统。

 

基于Numa互联的系统,通过使用共享内存或消息传递,有效地支持所有流行的高级编程模型。系统的大小还可以扩展到4k的节点,其中每个节点可以包含多个处理器。内存大小受限于Opteron处理器的48位物理地址范围,从而导致整体系统的主内存为256 TB。

 

Numa互联的核心是NUMA芯片;芯片上组合了高速一致性缓存的共享内存控制逻辑和7路交换及。从而减少了一个单独的,中心交换机,提高了线性容量,降低了成本。

 

目前,多核处理器芯片成为主流,使得更多的应用程来利用并行处理。Numa芯片利用多核,使应用程序能够在无需额外编程的情况下,无缝地对集群进行扩展。系统中,所有的任务都可以访问所有的内存和IO资源。这是其对用户的最大的价值。

 

除了高端企业服务器外,没有其他互连技术可以提供这种能力。

 

现在,所有的高速互连使用相同类型的物理接口,从而导致几乎相同的峰值带宽,其差别只是传输的延迟,功能的多少和软件兼容性。而NUMA互联区别于其他互联的地方是,通过提供统一的访问系统中的所有资源,并利用缓存技术,获得非常低的延迟。

 

主要性能:

● 可扩展的,针对皓龙处理器,基于目录的高速缓存,共享内存互连

● 通过HTX接口,转接模块或直接焊接到主板上

● 每个节点可远程配置

● 48位物理地址空间

● 系统中可高达4096个节点

● 1微秒的MPI延迟(ping-pong/2)

● 在NUMA芯片上,具有针对2维或3维拓扑的分布式交换架构

 

2.  Numascale公司的NUMA互联对多核处理器的能力扩展

 

半导体技术已经达到了这样一个水平,由于功耗与相应的散热和热的处理问题,处理器频率不能再明显增加。从历史上看,处理器的频率与晶体管密度大致相当,所有应用程序,无需额外编程工作,就能够达到性能的改进。现在的处理器芯片,并不是在一个封装上配备多个处理器,若要利用其新增的能力,需要具备并行处理软件。这对独立的和分隔的任务而言,显然是相当简单的,但若使单个任务加快,要复杂得多。

 

若使单一任务加快,其复杂性与需要做此任务的资源的逻辑距离有很大关系,能够共享的资源越少,其复杂性越大。

 

多核处理器共享主内存和某些高速缓存,即它们被归类为对称多处理器(SMP)。现代的处理器芯片配备了一些用于连接到其他处理器的信号和逻辑,这些信号和逻辑仍保持相同的逻辑共享内存。现实中,在单一的主板中,两到四个处理器插槽的开销不是增加了性能,而是减少了性能。

 

目前,超出单路/双路SMP主板规模的系统通过某种形式的网络连接可以实现,例如,使用以太网或更高速互联,像InfiniBand的互连;这样,在不同节点上运行的程序,需要通过明确的消息来进行通信。在这个模型中,超出小数量处理器规模的程序需要以一个更复杂的方式重写,其中的数据不能再被所有进程共享,但需要在不同的处理器内存中被显式地分解和传输。

 

NUMA互联采用了可扩展的方法来共享所有内存,并基于分布式目录来存储共享内存的位置。这意味着程序范围可以在编程原则没有任何变化的情况下,超越单主板的限制。系统中,运行在任何处理器下的任何进程可以使用内存的任何部分,无论其物理位置是否在相同的主板上。

如需进一步沟通,可发邮件至product_gao@163.com

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
非一致性内存访问(Non-Uniform Memory Access,NUMA)是一种计算机体系结构设计技术,可以在多处理器系统中提高内存访问性能。其基本原理是将内存分割成多个节点,每个节点可以被一个或多个处理器访问。每个节点都有自己的本地内存和I/O设备,节点之间可以通过互联网络进行通信。 当一个处理器需要访问内存时,它会首先尝试在本地内存中查找所需数据,如果本地内存中没有,则会向其他节点请求数据。这种方式可以减少内存访问的延迟,提高系统的整体性能。同时,由于每个节点都有自己的本地内存,可以减少多处理器之间的内存竞争,提高系统的可扩展性。 NUMA技术的工作原理可以总结为以下几个步骤: 1.将系统内存分割成多个节点,每个节点都有自己的本地内存和I/O设备。 2.将处理器分配到不同的节点上,每个节点可以被一个或多个处理器访问。 3.当一个处理器需要访问内存时,它会首先尝试在本地内存中查找所需数据,如果本地内存中没有,则会向其他节点请求数据。 4.数据传输通过互联网络进行通信,每个节点都可以通过网络访问其他节点的内存。 5.由于每个节点都有自己的本地内存,可以减少多处理器之间的内存竞争,提高系统的可扩展性。 总的来说,NUMA技术可以在多处理器系统中提高内存访问性能,使得系统能够更好地利用计算资源,提高计算效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值