加速游戏进行时(一)

 翻译自  Game on for Acceleration   http://kn.theiet.org/magazine/issues/0811/game-on.cfm

 

                                        加速游戏进行时

 

nVidiaCEO黄仁勋参加在公司总部圣克拉拉举行的与经济分析师的年会时,他面对着Intel的公开挑战,Intel声称他的公司和芯片在苟延残喘。

在中国举行的Intel开发者论坛上,IntelCTOPat Gelsinger声称:当今的图形架构已经走到了尽头,不能满足未来的需求。

此外,Intel的执行官声称,在未来,独立的GPU(图形处理器)对很多消费者来说是没有必要的,Intel将会取消GPU的插槽。黄仁勋对聚集的分析师说了一段引用自Intel的话:“集成芯片市场将持续增长……nVidia很快就会灭亡。这一逻辑是完美的……一个公司没有立足之地,没有什么比这更糟糕了。”

来自nVidia的对立观点是独立的GPU因为改善游戏效果而持续热卖,而Intel计划发售自己的独立GPU——Larrabee进入插槽。最终的结果即工业上称作的捆绑销售。黄仁勋认为,去年一共销售了3.66亿图形芯片,包括独立显卡和集成在主板上的图形卡。但是只销售了2.7亿的CPU。将近一亿的个人电脑同时拥有两个图形处理器,而只有一个被使用。

nVidia致力于增强GPU在个人电脑和通用架构中的作用,使GPU成为一个应用程序加速器。nVidiaGPU内部设计了一个针对浮点运算单元的编程环境,可以作为应用程序加速器,而不仅仅用于图形操作。“这是至今最强的超级电脑”,黄仁勋说。

超级电脑用户开始逐渐认同黄仁勋的观点,虽然这个市场不局限于nVidia和它的CUDA编程环境。Intel计划将Larrabee和它的Ct编程环境推向超级电脑市场,AMDATI单元为它的GPU提供了编程工具。

在过去十年里,个人电脑处理器的性能因为大规模并行架构而得到提升。现在人们开始关注电脑其它部分。一些人将目光转向IBM Cell处理器,一些人使用场可编程门阵列,一些人用GPU作实验。一些研究者,如田纳西大学计算机化学虚拟中心的Greg Peterson使用它们全部。

GPU的潜力

在最近的贝尔法斯特举行的多核和可重构高性能计算会议(MRSC)中,来自牛津的Mile Giles教授说GPU有离开个人电脑处理器的潜力:“时钟频率的提高,在功耗方面碰了钉子,由此存在着很多温度上的问题。因此处理器致力于向多核方向发展。而图形芯片进入多核时代由来已久,它们最多以达到128个核心。我可以说在很长的时间内,GPUIntel或者AMDCPU有着更强的浮点计算能力。”

Giles教授说:“问题在于对GPU的编程很困难,而这是会改变的。”他正在进行一个由英国工程和物理科学委员会资助的20万英镑的项目,项目旨在向研究者推广FPGAGPU的使用。

超级计算机制造者可以影响芯片设计的光辉年代已经不再。“我觉得我们不再是芯片发展的推动力量了,”Giles说,但他强调:“科学计算与图形计算更为相似,而不是办公计算。我喜欢GPU的一点是入门级的成本。”

科学计算用户最大的担心在于,当今的GPU是为单精度浮点数高效运算而设计,而科学计算用户希望可以使用双精度浮点。“我们需要单精度还是双精度?”Giles问。“我的印象中建立计算机流体动力学编码当不需要花费额外代价时可以转入双精度。我认为不是很有必要。但是单精度计算会得到与预期不同的结果,我觉得缺乏稳定性,是因为有待完善还是一些编译的bug?”

在曼彻斯特大学,Davide Bailey的研究小组使用ATI的显卡模拟粒子加速的行为。他指出nVidia已经领先于AMD:“每个人都进入CUDA编程环境因为AMD相应的环境还没有推出。我们一直使用Brook编译环境,有些过时了,但是能够在可编程性能力最强的GPU上工作,”Bailey在多核和可重构高性能计算会议上说。

“我们看到速度上的提高了吗?是的”,Bailey说。运行速度与是在Opteron主机上的四倍。“我们并没有看到大规模的提速。我认为这是因为主机与存储之间的拷贝。每次有潜在的碰撞就要作这样的拷贝操作。”

 GPU的问题是这样的,为了得到最大收益,必须同时发出很多线程,来掩盖GPU读取存储的时间消耗。而这不得不与GPU的快速存储大小进行折衷:很多并发执行的线程很容易就将GPU的现存消耗殆尽。如果应用程序考虑到这些限制重新编写,可能会看到性能成百倍的提高。然而伦敦皇家学院的George Constantinides告诫大家GPU的性能是脆弱的。

意大利大学高性能计算中心CASPURNico Sanna正进行放射性损伤DNA的仿真,他发现数据本身极大地影响了加速效果。“用于仿真的分子从根本上改变了计算性能。这是一条很重要的信息:这些分子编码改变了,”Sanna说。问题在于GPU加速的编码百分比变化很大。对甲烷来说,加速了指数函数30%的工作量,而对于大一点的富勒烯,只有2%的加速。

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值