Hugging Face 为开发者带来由 NVIDIA NIM 提供支持的推理即服务

最新推荐文章于 2024-11-18 19:00:00 发布

大模型实战

最新推荐文章于 2024-11-18 19:00:00 发布

阅读量688

点赞数 26

文章标签：人工智能 AIGC AI编程计算机视觉深度学习

本文链接：https://blog.csdn.net/sdfghwijiebvnd/article/details/141610144

版权

新服务通过热门 AI 模型为数百万开发者带来高达 5 倍的 token 效率提升，使他们能够立即访问在 NVIDIA DGX Cloud 上运行的 NIM 微服务。

不仅限于 Token 层面的提升 — NVIDIA NIM 带来巨大优势

近乎即时的 DGX Cloud 访问让 AI 加速触手可及

全球最大人工智能社区之一 Hugging Face 平台上的 400 万开发者在一些最热门的 AI 模型上可轻松获得 NVIDIA 加速推理。

借助新的推理即服务能力，开发者将能够快速部署 Llama 3 系列和 Mistral AI 模型等领先的大语言模型，并使用运行在 NVIDIA DGX Cloud 上的 NVIDIA NIM 微服务进行优化。

这项服务于今日在 SIGGRAPH 大会上发布，它将帮助开发者利用托管在 Hugging Face Hub 上的开源 AI 模型快速建立原型并将其部署在生产中。Enterprise Hub 用户可以利用 NVIDIA NIM 进行无服务器推理，以提高灵活性，尽可能降低基础设施用度并优化性能。

推理服务补充了在 DGX Cloud 端的训练（Train on DGX Cloud），一种已在 Hugging Face 上提供的 AI 训练服务。

由于开发者面对着越来越多的开源模型，可供其轻松比较各种选项的资源中心会非常有帮助。这些训练和推理工具为 Hugging Face 开发者提供了在 NVIDIA 加速基础设施上试验、测试和部署先进模型的新方法。它们可以通过 Hugging Face 模型卡上的“训练”和“部署”下拉菜单轻松访问，用户只需点击几下就能轻松使用这些功能。

开始使用由 NVIDIA NIM 提供支持的推理即服务。