众核技术报告会归来

来自Intel的消息:

特邀讲者:吴甘沙 高级主任研究员 英特尔中国研究中心编程系统实验室

演讲题目:Intel众核体系结构Larrabee以及数据并行编程模型Ct

Larabee

Larabee是Intel第一款Many Core处理器,目标是TFLOPS。讲演人并没有明确说明Larabee的目的,从wikipedia来看,Larabee被归类为GPU;但讲演人说明每个核心都可以跑一个操作系统,这点似乎为把Larabee归类为general purpose CPU做了注解,但个人更倾向于认为讲演人是在强调Larabee的指令集优势。也就是说,Larabee强调对GPU类的高并行性和X86CPU类的高可编程性的结合。在桌面环境的使用方式上,应该是一种加速器模式和通用CPU联合使用。无论是在图形加速市场还是科学计算市场。当然,在嵌入式市场,Larabee可以成为第一款片上众核通用处理器(Cell B.E显然不是众核),单一核心跑小型操作系统,这点对于Larabee来说不会形成瓶颈。

从体系结构上来说,Larabee包含大约32个简单x86核心,基于Pentium 4;每个核心支持4个硬件线程,为简单的顺序执行方式,双发射,强调较宽的vector宽度指令以支持高的并行度。同时,Larabee在片上提供一些fix-function unit,以增强图像处理能力。大量的多线程支持可以overlap内存延时和提高硬件效率,也弥补了没有乱序执行的缺点,但相比NVIDIA的warp instructions buffer,感觉还是后者来的精妙。

内存层次上,每个核心拥有一致性支持的两级Cache,每个核心之间使用双向ring bus互联,这点与Cell B.E有些类似。Larabee每个小核心可以使用load/store指令来拥有相同内存空间,这简化了编程。这点是与Cell B.E不同的地方。

总结:Larabee是一个CPU与GPU融合的产物。Larabee可以支持操作系统,但并不适合跑大型操作系统,也容易形成瓶颈;同时Larabee拥有特定的图像处理单元以增强图像处理能力。Larabee拥有较CPU有更好的并行能力,较GPU有更好的编程性。今后会以一种加速器形式与通用CPU进行协同工作,或用于嵌入式市场。

Ct:C/C++ for throughput computing

在现在的多核领域,显式或隐式的并行处理并不十分困难。然后对于众核处理器,让程序员显式的对每个核心进行编程将是一个非常困难的事情。CUDA的好处在于SIMT,每个指令基本上可以自动映射到每个处理核心,显然,Larabee也需要一个类似的编程模型,从而实现程序与多个核心的映射操作。

Ct的目的即在于此。讲演人对Ct细节说的不多,介绍的是Ct功能和编译方面的一些技术,如Ct主要是为了数据并行,支持C/C++,在编译器方面作了比较大的改进,实现二次编译,JIT等以完成类似于JVM的功能,从而实现对多个平台的支持。

抛开Ct技术细节,从原有的OpenMP支持到Intel自有的TBB,到现在的Ct,Intel向市场传递这么一个印象:Intel在推动多核、众核和并行计算的发展,这个推动不仅仅是处理器技术上的,更重要的是编程模型上的。我个人不知道Intel在OpenCL和Ct上分别的态度和想法,但无疑Ct会造成与OpenCL的直接竞争(Larabee平台)。再加上微软并不支持OpenCL,而是推出Directx11,这对今后几年桌面并行计算的标准来说可能是个稍显混乱的局面。当然,个人还是看好OpenCL,在于其平台无关和更多的业界支持。


AMD

特邀讲者:刘文卓 中国区技术总监,AMD中国

演讲题目: CPU 与 GPU 的融合,以及加速计算的前景与挑战

AMD的讲座技术性不强,更多的是传递理念。

融合:

AMD所谓的融合,目前是单机层面上的CPU+GPU融合。AMD在购入ATI的时候即瞄准这个目标。AMD应该是最早提出GPGPU的厂商,可很遗憾在GPU编程方面落后于NVIDIA。

在片上的融合,AMD提出了一个时间表。最终的样子是一个与Larabee完全不同的架构。Larabee强调同构、众核;AMD强调异构、众核。如果把力度放大,AMD的CPU是一个CPU+一个GPU放在一个chip上面,这点与Cell B.E类似。

片上异构也是我个人比较欣赏的一种方式,原因是单机异构的存储瓶颈问题(这个问题在中石油也被客户所提到)。直觉上,片上异构可以改善通用CPU和专用die之间的通信,尤其是专用die与系统内存之间的通信瓶颈将大大改善(可能需要MMU和操作系统参与内存计算,所以操作系统和driver层面可能需要有所变动)。另外一个原因是SoC总是最容易被嵌入到设备中去的,无论是桌面还是嵌入市场。


openCL

AMD提到了openCL,基本上AMD是对openCL持肯定态度的。并做了一些远景介绍,如支持多种体系结构,可以将并行放置在更多的平台,甚至手持设备等。


特邀讲者:邢座程  博士,国防科技大学计算机系教授

演讲题目:面向科学计算---银河飞腾多核处理器发展思路

邢教授显然是个务实的研究者。在对比了TOP500处理器主流芯片架构之后,邢教授仍从对称多核处理器入手,基于自己以前的积累,进行主流多核芯片的研究和生产。

该报告更多的是从研究方法论上入手去阐述飞腾处理器研究工作的。


特邀讲者:范东睿 博士,中科院计算所副研究员

演讲题目: Godson-T--高效能众核处理器设计

范老师做的是TFLOPS-Oriented众核处理器设计,偏研究,架构也是同构众核处理器。突出的地方是众核的拓扑机构,核间通信方式等内容。因为更偏理论性,我个人还不能很好理解。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值