卷二 APO超级电脑架构

                                                                  卷二     APO超级电脑架构

             APO超级电脑架构由最多16个核组成,核间的连接是256位差分数据通信总线。超级电脑主要部件:带流处理器的32位CPU核,最大256TH的共享DDR内存模块,总线协调器。部件通过256位高速数据总线及一对时钟线互连。MLVDS技术,1GHZ总线频率,一个时钟周期内传输两次数据,它能够在时钟的上升期和下降期各传输一次数据。等效一对数据线传输频率就能达到2GHZ。所以,高速数据总线传输速率为:512Gbit/s或64GB/s 或32GZ/s 或16GW/s或2GH/S。用一个总线协调器最大互连16个部件。未来可能有6.4GHZ总线频率,传输速率达到409.6GB/s或102.4GW/s或12.8GH/S。


         CPU核的本地内存最大4GH,分为64K个块,每块64KH。可程序选择任一块连到高速数据总线接口的发送端或接收端。一行H为256bit或32B或8W;高速数据总线一次传输一行。CPU核主要有:用户进程管理者(用户进程);空间管理者(共享DDR内存空间256TH、硬盘空间16EH的管理,文件系统);时间管理者(对象生存时间管理、实时时间、定时器事件、实时事件消息处理等);网络管理者(网络连接管理);实时图像、声音、感觉采集管理者;图像、声音识别、思考数据库管理者(脑海);语言管理者;图像、声音等输出管理者(显卡、声卡等输出功能)。虚拟智能生命管理者等等。


          CPU核的流处理器,这是CPU内的一个简单逻辑门电路功能块。它的功能非常强大,一条指令就可对1M(百万)对单精度浮点数做乘法、乘加或加法或减法或除法等运算,还有更强大的功能;后面会逐步介绍。单精度浮点数乘法的速度是:4TFlops/S。当然,你也可对共享DDR上数万亿个数据对进行运算,速度基本上是取决于高速数据总线的速度,即是每秒40亿的数据对4G/S。也就是说数据流进入流处理器的输入端,其输出端结果就能返流回DDR。那些号称T级/S运算的多核CPU或GPU,数据总线带宽不到8GB/S;有用吗?APO的总线速度是64GB/s啊;未来的技术应能做到409.6GB/S。1块超级电脑主板16核,理论上单精度浮点数乘法的速度就可达到64TFlops/S。10万块超级电脑主板组合成的超级电脑,理论上单精度浮点数乘法的速度就可达到6400PFlops/S。远超超级计算机-天河二号33.86 PFlops/S。


          CPU核的本地总线同样是256位,连接最多4GH的本地内存。本地总线的部件有:高速数据总线接口;64K位流处理器;32位CPU核;外部设备总线控制器。部件的操作都是由32位CPU核的指令操控。外部总线的操作有:共享DDR外部内存与本地内存,共享DDR外部内存与流处理器,CPU核与外总线部件的消息传递。


        分工合作,并行处理才是高效做事的方式。用户管理者管理着8K个用户进程,每个进程有很多消息需处理;许多消息的处理都需分派到其它部件来处理的。比如,一个用户进程需打开一个文件,不过是形成一个消息发给空间管理者去处理。

 

          APO超强的汇编指令,估计相当于WINDOWS、LINUX操作系统功能的代码量不到4K字,而不会象WINDOWS的以GW为单位。4K字,4K行的代码也是非常难的事啊;3万行的代码应能搞定一切软件。而LINUX操作系统的原代码量,居然达到将近千万行。太惊人了!之所以这样,硬件是最大的过错!


       
      千里之行,始于足下!我会从最简单开始,让我们一起开始APO超级电脑架构之旅吧!


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值