使用Triton部署ONNX模型

介绍

适用于各种 AI 工作负载的推理:借助 NVIDIA Triton™,在任何处理器(GPU、CPU 或其他)上,对使用基于任何框架的,经过训练的机器学习模型或深度学习模型,进行推理部署。Triton 是 NVIDIA AI 平台的一部分,可通过 NVIDIA AI Enterprise 获取。这款开源软件可针对各种工作负载,实现标准化的 AI 模型部署和执行。

优势

支持所有训练和推理框架:使用 Triton,部署基于任何主流框架的 AI 模型,包括 TensorFlow,PyTorch,Python,ONNX,NVIDIA® TensorRT™、RAPIDS™ cuML,XGBoost,scikit-learn RandomForest,OpenVINO,C++ 自定义框架等。

可在任何平台上实现高性能推理:借助动态批处理、并发执行、最佳模型配置,音视频串流输入支持,最大限度地提升吞吐量和资源利用率。Triton 支持所有 NVIDIA GPU,x86 和 Arm® 架构 CPU 以及 AWS Inferentia。

专为 DevOps 和 MLOps 设计的开源软件:可将 Triton 集成到 DevOps 和 MLOps 解决方案中,例如集成到 Kubernetes 实现规模化,或集成到 Prometheus 进行监测。Triton 也可以通过所有主流云平台、本地 AI 平台和 MLOps 平台获取。

企业级安全性、可管理性和 API 稳定性:NVIDIA AI Enterprise(包括 NVIDIA Triton 和 Triton Management Service),是一个安全的、生产就绪型的 AI 软件平台,提供支持、安全性和 API 稳定性,帮助企业加速开发 AI,实现收益。

镜像介绍

在这里插入图片描述

部署ONNX模型

在这里插入图片描述
将onnx模型按照 base_path /model_name / version / model.onnx 的模式放入指定文件夹中,onnx模型可以不指定config.pbtxt。

nvidia-Triton官方文档中根据CUDA和Ubuntu版本选择合适的镜像,CUDA版本需要不大于系统安装的CUDA版本。

运行指令创建Triton推理容器

$ docker run --gpus=1 --rm -p8000:8000 -p8001:8001 -p8002:8002 -v/full/path/to/docs/examples/model_repository:/models nvcr.io/nvidia/tritonserver:<xx.yy>-py3 tritonserver --model-repository=/models
  • 12
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DeepStream是一个用于视频分析的应用程序框架,而Triton是一个用于推理部署的开源平台。结合使用DeepStream和Triton可以实现高效的视频分析和推理部署。下面提供一个简单的教程,帮助你了解如何使用DeepStream和Triton进行部署。 1. 安装DeepStream 首先,你需要安装DeepStream。你可以从NVIDIA的官方网站下载最新版本的DeepStream,也可以使用包管理器进行安装。 2. 安装Triton 接下来,你需要安装Triton。你可以从NVIDIA的官方网站下载最新版本的Triton,也可以使用包管理器进行安装。安装完成后,你需要启动Triton服务。 3. 创建DeepStream应用程序 创建一个DeepStream应用程序,用于将视频流发送到Triton进行推理。你可以使用DeepStream SDK提供的示例代码作为基础,或者根据自己的需求编写应用程序。 4. 配置DeepStream 在DeepStream应用程序中,你需要配置DeepStream管道,将视频流发送到Triton进行推理。在配置文件中,你需要指定Triton服务器的IP地址和端口号,以及模型的名称和版本号。 5. 部署模型 使用Triton客户端将模型部署Triton服务器上。你需要指定模型的名称、版本号、输入和输出格式等信息。部署完成后,你可以使用DeepStream应用程序发送视频流进行推理。 6. 运行DeepStream 运行DeepStream应用程序,将视频流发送到Triton进行推理。你可以使用DeepStream提供的命令行工具或者API进行控制和管理。 以上是一个简单的教程,帮助你了解如何使用DeepStream和Triton进行部署。当然,具体的实现细节还需要根据你的具体需求进行调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值