【TechWeb】5月22日,芯片性能提升的一小步往往能带来产业发展的一大步。在人工智能/机器学习(AI/ML)和高带宽数据加速应用需求日益增长的今天,Achronix半导体公司推出FPGA系列产品Speedster7t来满足这一快速增长的市场需求。
Achronix半导体公司是一家私有的、采用无晶圆厂模式的半导体公司,总部位于美国加利福尼亚州圣克拉拉市,同时提供高性能FPGA和嵌入式FPGA(EFPGA)解决方案。Achronix在美国、欧洲和中国都设有销售办公室和代表处,在印度班加罗尔设有一间研发和设计办公室。
(Achronix Semiconductor总裁兼首席执行官Robert Blake)
AI/ML的应用场景快速发展演进,对芯片的算力、安全性等提出更高要求。据Achronix Semiconductor总裁兼首席执行官Robert Blake介绍,全新Speedster7t系列产品专为机器学习市场和高带宽网络应用而进行了优化,它的创新架构和ACE软件工具为要求更高性能和更短设计周期的设计提供了全新范式。同时Speedster7t器件采用台积电(TSMC)的7nm FinFET工艺制造,专为接收来自多个高速来源的大量数据而设计。
关于Speedster7t相比之前产品在算力提升方面的情况,Robert Blake向TechWeb介绍,“在SerDes高速接口方面,之前的数据速率是10Gbit/s,现在最高可达112Gbit/s,提升了10倍之多。在计算能力方面,现在的每一个MLP(机器学习处理器)和以前用的每一个DSP相比,算力提升了5倍,另外MLP的尺寸做得更小,如果同时考虑尺寸和算力,总体计算能力也是原来的10倍以上。”
此外,在Speedster7t的AI适用场景方面,Robert Blake则向TechWeb表示“在AI领域中有很多新的算法,以前是CNN(卷积神经网络)做图像处理,现在有RNN(Recursive Neural Network,递归神经网络)做语音处理,还有Transformer算法等等,所有新的这些算法都没有传统的架构可以去处理,我们觉得都很适合在FPGA里处理。”
Robert Blake称:“具体到FPGA在AI领域的应用则非常广泛,包括图像处理、语音处理、数据加速、网络加速、加密等等。未来有很多应用是要去处理非结构化的文字信息,用GPU、CPU来处理的效率和结果都不会有FPGA更高效、更准确。”
据介绍,Achronix将在第三季度发布很多高性能应用案例,来介绍其如何帮助客户去提升速度、性能。
具体的,Speedster7t FPGA系列产品是专为高带宽应用进行设计,具有一个革命性的全新二维片上网络(2D NoC),以及一个高密度全新机器学习处理器(MLP)模块阵列。通过将FPGA的可编程性与ASIC的布线结构和计算引擎完美地结合在一起,Speedster7t系列产品创造了一类全新的“FPGA +”技术。
在开发Speedster7t系列FPGA的产品过程中,Achronix的工程团队完全重新构想了整个FPGA架构,以平衡片上处理、互连和外部输入输出接口(I / O),以实现数据密集型应用吞吐量的最大化,这些应用场景可见于那些基于边缘和基于服务器的AI / ML应用、网络处理和存储。
Speedster7t FPGA的核心是其全新机器学习处理器(MLP)中大规模的可编程计算单元平行阵列,它们可提供业界最高的、基于FPGA的计算密度。MLP是高度可配置的、计算密集型的单元模块,可支持4到24位的整点格式和高效的浮点模式,包括对TensorFlow的16位格式的支持,以及可使每个MLP的计算引擎加倍的增压块浮点格式的直接支持。
MLP与嵌入式存储器模块紧密相邻,通过消除传统设计中与FPGA布线相关的延迟,来确保以750 MHz的最高性能将数据传送到MLP。这种高密度计算和高性能数据传输的结合使得处理器逻辑阵列能够提供基于FPGA的最高可用计算能力以每秒万亿次运算数量为单位(TOPS,Tera-Operations Per Second)。
除了算力提升外,存储器带宽也得到了扩展。Speedster7t器件是唯一支持GDDR6存储器的FPGA,该类存储器是具有最高带宽的外部存储器件。每个GDDR6存储控制器都能够支持512 Gbps的带宽,Speedster7t器件中有多达8个GDDR6控制器,可以支持4 Tbps的GDDR6累加带宽。
据介绍,Speedster7t FPGA器件的大小范围为从363K至2.6M 的6输入查找表(LUT)。支持所有Achronix产品的ACE设计工具现已可提供,可支持包括Speedcore eFPGA和SpeedchipFPGA多晶粒封装芯片(Chiplet)。第一批用于评估的器件和开发板将于2019年第四季度提供。