超级计算机 26010,解析申威26010处理器结构(附:国产超算发展史)

本文详细解析了申威26010处理器的结构,每个核心拥有独立的内存带宽,总计32GB DDR3内存。处理器包含4个主处理器和计算单元阵列,支持矢量指令集,总计260个处理器核心。对比Intel Xeon Phi,申威26010在核心数量和内存直连方面展现出优势,适合高性能计算应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

申威26010处理器每片处理器包含4个核心,片上的4个核心通过片上网络互联,并通过PCI-E 3.0对外连接,每个核心拥有独立的128位DDR3控制器连接到8GB DDR3-2133内存,这样4个核心一共拥有32GB的DDR3内存。

a9b9a22da161210812f2e1719de5287a.png

a96990b68775f2cc6785e6574f1514bc.png

从这里可以看出SW26010实际上类似于用胶水把4个独立的处理器粘在了一起,整合到了一个芯片里面,但是每个核心还是可以独立工作,而且拥有独立的128bit 8GB内存。这样单个核心的内存带宽达到了34GB/s,整个处理器达到了136GB/s,这样设计最大的好处就是每个核心的带宽是完全独享的,缺点是空闲核心的带宽无法共享给其他核心。

其中每个核心包含一个主处理器(MPE)和一个8*8的计算单元阵列(CPEs),主处理器是一个64位的RISC架构核心,用来跑操作系统,并且支持264位的矢量指令集,拥有32KB的L1指令缓存和32KB的L1数据缓存(总共64KB L1 cache),和256KB L2 Cache,应该说这样的缓存配置并不算大,应该是为了节约芯片面积考虑,4个核心的主处理器加起来一共有256KB L1 cache和1MB L2 cache。

计算单元阵列(CPEs)是一个由64个简化的62bit处理器(不是常见的64bit)组成,每个处理器只有16KB的L1指令缓存和64KB本地储存,没有L1数据缓存,并且和主处理器一样支持264位的矢量指令集,单片处理器拥有一共256个这样的计算单元。

于是加上4个主处理器,单片处理器一共拥有260个处理器核心。

e187d9ba4c58a93bf2cb3933721dae62.png

神威·太湖之光的每个处理器卡有两片SW26010处理器,和一共64GB内存,长得像这样,每个处理器算一个计算节点,这样一块处理器卡和intel xeon phi协处理器卡类似,只是intel这样一块计算卡只有区区60个核心,而且不能独立工作,还需要另外购买一个独立的xeon主机作为管理处理器使用。而SW26010处理器集成了管理处理器,可以独立工作,并且单个处理器卡拥有高达520个处理器核心。

145b91cf585cb448c967baf8ac9d8643.png

对比一下intel xeon phi计算系统的结构:

c96d43e9760fe6a4e782d1f11e8c6d25.png

KNC Card就是一块intelXeon Phi协处理器卡,协处理器卡通过PCIE-X16和主处理器相连,其实看上去就像是一台PC上面插着好几块显卡。这样一台PC构成一个计算节点。

对比SW26010处理器的方案,单个节点来看,一块SW26010的核心数量和一台带有4块xeon phi计算卡的功能相当。Intel方案的麻烦在于,这样一个计算节点的功耗和体积远远大于SW26010,而且intel主处理器内存和协处理器卡的内存是分离的,需要先将要处理的数据通过PCI-E x16传输至计算卡内存,然后计算卡才能计算,最后将结果通过PCI-E x16读回主处理器,这样一来一回的性能损失很多时候远大于计算卡带来的好处。 1

2

3

4

下一页>

唯样商城-电子元器件采购网(www.oneyac.com)是本土元器件目录分销商,采用“小批量、现货、样品”销售模式,致力于满足客户多型号、高质量、快速交付的采购需求。

唯样自建高效智能仓储,拥有自营库存超过50,000种,提供一站式正品现货采购、个性化解决方案、选型替代等多元化服务。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值