原创 AI苏妲己
SambaNova——一家总部位于帕洛阿尔托的公司已经筹集了超过10亿美元的风险投资,不会直接向公司出售芯片。相反,它出售其定制技术堆栈的访问权限,该堆栈具有专门为运行最大的人工智能模型而设计的专有硬件和软件。
最近,SambaNova宣布推出了其新型SN40L处理器,该处理器拥有1020亿个晶体管,分布在1040个核心上,能够达到638teraflops运算的速度,采用TSMC的5纳米工艺制造,SN40L最引人注目的特点之一是它的三级存储系统,专为处理与AI工作负载相关的大量数据流而设计。SambaNova声称,仅由八个这样的芯片组成的节点就能够支持高达5万亿个参数的模型。这几乎是OpenAI的GPT-4大型语言模型大小的三倍,并且能够处理高达256,000个tokens的序列长度。该公司声称,与需要数百个芯片的行业标准GPU相比,这代表了总拥有成本的显著降低。
可重构数据流架构是SambaNova芯片的核心,它能够根据不同人工智能模型的需求,动态调整芯片内部的数据通路,实现高效的计算和数据流动。下面我们来详细了解一下这种架构的特点和优势。
1.可重构互连:灵活连接计算、存储和通信单元
SambaNova芯片包含大量的计算单元(PCU)、存储单元(PMU)和通信交换单元(SCU),它们按阵列平铺排列。计算单元