Achronix推出突破性的新FPGA系列产品

640?wx_fmt=gif


5月 21日,基于现场可编程门阵列(FPGA)的硬件加速器件和高性能嵌入式FPGA(eFPGA)半导体知识产权(IP)领导性企业Achronix半导体公司宣布推出创新性、全新的FPGA系列产品,以满足人工智能/机器学习(AI/ML)和高带宽数据加速应用日益增长的需求。


Achronix半导体公司是一家采用无晶圆厂模式的半导体公司,也是高性能FPGA市场的主要推动者。Achronix能够同时提供高性能FPGA和嵌入式FPGA(EFPGA)解决方案,其产品包括可编程的FPGA结构、具有硬连线系统级模块的分立式高性能和高密度FPGA、数据中心和HPC硬件加速器板,以及支持所有Achronix产品的一流EDA软件。


此次推出的Speedster®7t系列是基于高度优化的全新架构,具有如同ASIC一样的性能、可简化设计的FPGA灵活性和增强功能,远超越传统FPGA解决方案。全新的Speedster7t FPGA系列产品是专为高带宽应用所设计,具有革命性的全新二维片上网络(2D NoC),以及高密度全新机器学习处理器(MLP)模块阵列,通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美结合在一起。


640?wx_fmt=png

Achronix Semiconductor总裁兼首席执行官

Robert Blake正在详细介绍新系列产品


Achronix Semiconductor总裁兼首席执行官Robert Blake表示:“Speedster7t是Achronix历史上最令人激动的发布,代表了建立在四个架构代系的硬件和软件开发基础上的创新和积淀,以及与我们领先客户之间的密切合作。Speedster7t是灵活的FPGA技术与ASIC核心效率的融合,从而提供了一个全新的‘FPGA+’芯片品类,它们可以将高性能技术的极限大大提升。


说起Speedster7t系列FPGA产品的开发过程,Robert Blake介绍说,Achronix工程团队完全重新构想了整个FPGA架构。以平衡片上处理、互连和外部输入输出接口(I / O),以实现数据密集型应用吞吐量的最大化,这些应用场景可见于基于边缘和基于服务器的AI / ML应用、网络处理和存储。


此外,Speedster7t器件采用了台积电(TSMC)的7nm FinFET工艺制造,是专为接收来自多个高速来源的大量数据而设计,同时还需要将那些数据分发到可编程片上算法性和处理性单元中,然后以尽可能低的延迟来提供结果。Speedster7t系列产品包括高带宽GDDR6接口、400G以太网端口和PCI Express Gen5等接口,所有这一切单元都互相连接以提供ASIC级带宽,同时保留FPGA的完全可编程性。


随着人工智能/机器学习应用场景的快速发展,对当前市场推出的新解决方案从高性能、灵活性和上市时间等方面提出了新的需求。而根据市场调研公司Semico Research预测,人工智能应用中FPGA的市场规模将在未来4年内增长3倍,达到52亿美元。


“Achronix全新的Speedster7t FPGA系列产品是创新性芯片架构实现爆发的一个卓越案例,创造该架构的目的是直接面向AI应用处理大量的数据。” Semico Research公司ASIC和SoC首席市场分析师Rich Wawrzyniak说,“通过将数学函数、存储器和可编程性整合到其机器学习处理器中,再结合交叉芯片、二维NoC结构,从而形成了消除瓶颈和确保整个器件中数据自由流动的绝佳方法。在AI / ML应用中,内存带宽就是一切,Achronix的Speedster7t在这一领域提供了令人印象深刻的性能指标。


为计算性能进行高度优化


Speedster7t FPGA的核心是其全新机器学习处理器(MLP)中大规模的可编程计算单元平行阵列。它们可以提供业界最高的、基于FPGA的计算密度。MLP是高度可配置的、计算密集型的单元模块,可支持4-24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。


MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750 MHz的最高性能将数据传送到MLP。这种高密度计算和高性能数据传输的结合使得处理器逻辑阵列能够提供基于FPGA的最高可用计算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。


世界级带宽解决方案


高性能计算和机器学习系统的关键之处是高片外存储器带宽,从而为多个数据流提供存储源和缓冲。 在当前FPGA领域可采用的HBM2和GDDR6两种高带宽传输方案中,Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。每个GDDR6存储控制器都能支持512 Gbps的带宽,而且Speedster7t器件中有多达8个GDDR6控制器,可以支持4 Tbps的GDDR6累加带宽,并且以很小的成本就可提供与基于HBM的FPGA等效存储带宽。


 “美光(Micron)乐于携手Achronix去实现全球第一个面向高带宽存储需求而直接加载了GDDR6的FPGA产品。”美光计算与联网业务部营销副总裁Mal Humphrey表示,“像这样创新和可扩展的解决方案将推动人工智能领域内的差异化,其中异构计算可选方案与高性能存储是加速获得数据内涵的必需部分。


同时,Speedster7t器件还包括业界最高性能的接口端口,以支持极高带宽的数据流。据了解,Speedster7t器件拥有多达72个业界最高性能的SerDes,可以达到1-112 Gbps的速度,还有带有前向纠错(FEC)的硬件400G以太网MAC,支持4x 100G和8x 50G的配置,以及每个控制器有8个或16个通道的硬件PCI Express Gen5控制器。


超高效率的数据移动


来自Speedster7t高速I / O和存储器端口的数万兆比特数据很容易淹没传统FPGA面向比特位的可编程互连逻辑阵列的路由容量,而Speedster7t架构包含一个可横跨和垂直跨越FPGA逻辑阵列的创新性、高带宽的二维片上网络(NOC),它们连接到所有FPGA的高速数据和存储器接口,就像叠加在FPGA互连这个城市街道系统上的空中高速公路网络一样,Speedster7t的NoC支持片上处理引擎之间所需的高带宽通信。NoC中的每一行或每一列都可作为两个256位实现,单向、行业标准的AXI通道,工作频率为2Ghz,同时可为每个方向提供512 Gbps的数据流量。


通过在Speedster中实现专用二维 NoC, 极大地简化了高速数据移动,并确保数据流可以轻松地定向到整个FPGA结构中的任何自定义处理引擎。NOC还消除了传统FPGA使用可编程路由和逻辑查找表资源在整个FPGA中移动数据流中出现的拥塞和性能瓶颈。这种高性能网络不仅可以提高Speedster7t FPGA的总带宽容量,还可以在降低功耗的同时提高有效LUT容量。


面对大批量需求

提供向低成本ASIC转换的途径


Achronix是唯一一家既提供独立FPGA芯片又提供Speedcore™嵌入式FPGA(eFPGA)半导体知识产权( IP)的公司。Achronix在Speedcore eFPGA IP中采用了与Speedster7t FPGA中使用的同一种技术,可支持从Speedster7t FPGA到ASIC的无缝转换。FPGA应用通常具有必须保持可编程性的功能,而其他固定功能则是专用于特定的系统应用。对于ASIC的转换而言,固定功能可以被固化进ASIC结构中,从而减小芯片面积、成本和功耗。当使用Speedcore eFPGA IP将Speedster7t FPGA转换为ASIC时,客户有望节省高达50%的功耗并降低90%的成本。


关于此次新系列产品供货,据了解,Speedster7t FPGA器件支持所有Achronix产品的ACE设计工具现已可提供,可支持包括Speedcore eFPGA和Speedchip™FPGA多晶粒封装芯片(Chiplet)。第一批用于评估的器件和开发板将于2019年第四季度提供。


640?wx_fmt=gif


640?wx_fmt=jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值