ONNX (Open Neural Network Exchange)是一套表示深度神经网络模型的开放格式,由微软和 Facebook 于 2017 推出,然后迅速得到了各大厂商和框架的支持。目前,在数家机构的共同维护下,ONNX 已经对接了多种深度学习框架和多种推理引擎。
通过短短几年的发展,已经成为表示深度学习模型的实际标准,并且通过 ONNX-ML,可以支持传统非神经网络机器学习模型,大有一统整个 AI模型交换格式。
ONNX 定义了一组与环境和平台无关的标准格式,为 AI 模型的互操作性提供了基础,使 AI 模型可以在不同框架和环境下交互使用。硬件和软件厂商可以基于 ONNX 标准优化模型性能,让所有兼容 ONNX 标准的框架受益。
各种神经网络模型转化为 ONNX 格式后,可以很容易的部署在兼容 ONNX 的运行环境中。兼容 ONNX 的运行环境称为ONNX运行时(ONNX runtime)。谈到运行时,我们就有了虚拟机的概念,ONNX就好比是一种模型的中间语言,可以在任何的ONNX 运行时上运行,真的很酷。

有了ONNX,大模型可以在各种硬件上运行,比如Apple,Intel,Nvidia,甚至华为等国产算力平台上运行了。

最低0.47元/天 解锁文章
317

被折叠的 条评论
为什么被折叠?



