据了解,Goya是一款基于PCle的双槽位处理器,可基于ResNet-50推理基准实现每秒15,000张图片的吞吐量,延迟时间仅为1.3毫秒, 功耗仅为100瓦。它主要用于传统服务器环境,提供推理和预测支持。
据他介绍,Goya还为用户提供了一套名为Synapse AI的软件环境。SynapseAI软件栈包含一个丰富的内核库和开放工具链,以供用户添加专有内核。借此,用户不仅可以直接部署模型、进行定制化操作,同时还能帮助使用CPU和GPU的用户快速、轻松、准确地将之前的工作部署到Goya上。
AI训练处理器「Gaudi」