Stratix®10 NX:超越GPU的人工智能时代“最强”FPGA?

本文深入探讨了英特尔Stratix®10 NX FPGA在人工智能领域的微架构创新,与GPU(如英伟达T4和V100)的实际算力对比。研究发现,通过优化FPGA架构和资源利用,Stratix®10 NX FPGA在AI推理应用中性能平均提升24.2倍和11.7倍,能效比GPU高8到16倍。关键在于FPGA的张量单元利用率及NPU设计,使得实际性能更接近峰值性能。
摘要由CSDN通过智能技术生成

任何科学技术的发展和进步都离不开两个主要的推动力量,一个是科学研究,另外一个是工程实践。这两者是相互补充、相互促进的关系。科学研究主要考虑的是做什么,而工程实践主要考虑的是怎么做。
拿芯片行业举例,我们需要不断思考和研究很多问题,才能保持这个行业的不断发展和前进。比如,怎么去设计更有效的芯片架构,让芯片的性能更强、功耗更低;怎么去提升芯片设计软件的性能,从而简化芯片设计的过程、缩短开发时间;怎么结合其他领域的知识,比如人工智能,来帮助我们做芯片的设计和制造。

在12月刚刚结束的名叫FPT的国际会议上,英特尔、多伦多大学、康奈尔大学的学者发表了一篇论文,详细介绍了Stratix®10NXFPGA的主要微架构创新,以及它与英伟达GPU进行实际算力对比时取得的性能提升。本文将对这项成果的具体内容进行深入解读,让各位先睹为快。

FPGA领域的主要研究热点

首先值得一提的是,可编程逻辑芯片和FPGA领域一共有四个顶级的国际学术会议,前面提到的FPT,也就是FieldProgrammableTechnology,就是其中之一。它常年在亚太地区巡回举办。剩下的三个,分别是FPGA、FCCM和FPL。

根据这次FPT的论文收录情况,从整体上看,目前可编程逻辑芯片和FPGA在学术界的研究方向主要集中在两个方面:

一个是和人工智能相关的领域,比如根据AI应用进行FPGA微架构的优化、或者做一些跨学科的结合。

另一个方向,就是将FPGA作为硬件加速器,应用在云计算或者数据中心里。

除此之外,关于FPGA高层次综合的内容也仍然是热点之一,但是在AI大火的这几年,HLS的热度好像在最近稍显褪色。

根据我的不完全统计,今年F

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值