YOLOV3在Triton Inference Server部署并进行对象检测

最新推荐文章于 2024-01-24 16:35:20 发布

玻璃晴朗,橘子辉煌

最新推荐文章于 2024-01-24 16:35:20 发布

阅读量3.1k

点赞数 2

文章标签： tensorflow python docker 机器学习

本文链接：https://blog.csdn.net/endtiny/article/details/107931916

版权

本文介绍了如何在Triton Inference Server上部署YOLOV3模型进行对象检测。首先从YOLO官网获取YOLOV3的权重文件，然后在TensorRT环境中构建.yolov3.weights到.yolov3.plan的模型转换。接着，编写config.pbtxt配置文件并将模型部署到Triton Server。最后通过yolo_client.py进行检测验证，检测结果图片保存在./detected_image目录下。

摘要由CSDN通过智能技术生成

注：原 TensorRT Inference Server 官方已改名为 Triton Inference Server

需要的镜像文件

nvcr.io/nvidia/tensorrtserver:19.10-py3
nvcr.io/nvidia/tensorrt:19.10-py2
enisberk/tensorrtserver_client:19.05

1、生成YOLOV3的.plan模型

首先在 YOLO官网下载YOLOV3的yolov3.weights

Clone代码 yolov3-tensorrt

启动tensorrt容器：

docker run -it --name trt -v /yolov3-tensorrt:/yolov3-tensorrt nvcr.io/nvidia/tensorrt:19.10-py2

进入容器并构建yolov3.plan：

# 进入容器（之后步骤都是在容器内执行）
docker exec -it trt /bin/bash
# 进入yolov3-tensorrt目录，执行yolov3_to_onnx脚本。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

玻璃晴朗,橘子辉煌

关注关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【ai】tx2 nx：ubuntu18.04 yolov4-triton-tensorrt 成功部署server 运行

突围

06-25

199

yolov4-triton-tensorrt

【ai】tx2 nx： jetson Triton Inference Server 部署YOLOv4

最新发布

突围

06-24

jetson

3 条评论您还未登录，请先登录后发表或查看评论

深度学习部署：Triton（Triton inference server）【旧称：TensorRT serving，专门针对TensorRT设计的服务器框架，后来变为Triton，支持其他推理后端】

u013250861的博客

08-01

2304

一般来说，我们都是从最主要的server开始编，编译的时候会链接core、common、backend中的代码，其他自定义backend（比如tensorrt_backend）在编译的时候也需要带上common、core、backend这三个仓库，这些关系我们可以从相应的CMakeList中找到。官方也提供了客户端，C++和python的都可以有，可以直接使用官方的，也可以根据官方提供的http协议构造自己的客户端，只要会构造body，一切都很简单。就可以发送请求，结果也会传回response里。

指南：Triton Inference Server

01-24

2974

关于triton inference server的详细记录，涉及安装，服务部署，优化。通过例子一步一步搭建一个可实际使用的服务。

Triton Server 快速入门

xzpdxz的博客

04-04

2901

Triton提供了一个叫做instance-group的模型配置项，允许指定每一个模型允许的并发实例的数量,这些并发的模型数量称之为一个instance。默认情况下，Triton是一个GPU上放一个模型，一次只推理一份数据。但通过设置模型的instance_group参数，可以对模型的并发实例数据量进行扩充。2.–model-control-mode=poll该参数用于启动模型热更新，当模型文件发生变化，或者新增版本时，程序先启动新的实例版本出来，在将旧版本或者实例卸载掉。

服务器：Triton Inference Server提供了优化的云和边缘推理解决方案

02-04

yolov4-triton-tensorrt:该存储库将YOLOv4作为优化的TensorRT引擎部署到Triton Inference Server

03-21

使用TensorRT的Triton Inference Server上的YOLOv4 该存储库展示了如何将YOLOv4作为优化的引擎部署到。 Triton Inference Server具有许多现成的优势，可用于模型部署，例如GRPC和HTTP接口，在多个GPU上自动调度，共享内存（甚至在GPU上），运行状况度量和内存资源管理。 TensorRT将通过融合层并为我们的特定硬件选择最快的层实现来自动优化模型的吞吐量和延迟。我们将使用TensorRT API从头开始生成网络，并将所有不支持的图层添加为插件。构建TensorRT引擎除了运行中的具有GPU支持的docker环境外，不需要运行此代码的依赖项。我们将在TensorRT NGC容器内运行所有编译，以避免必须本地安装TensorRT。运行以下命令以获取带有我们的回购代码的可运行TensorRT容器： cd yourwork

TensorRT部署-使用TensorRT+Triton加速部署YOLOv4-项目实战-附完整流程教程.zip

01-18

在本项目实战中，我们将深入探讨如何利用TensorRT和Triton进行深度学习模型的高效部署，特别是针对YOLOv4这一流行的物体检测模型。TensorRT是一个由NVIDIA开发的高性能深度学习推理（Inference）优化器和运行时，它...

Triton服务器部署Yolov5s模型应用

space01的专栏

05-15

1295

目录 1. Triton介绍 2.Yolov5s模型部署 2.1Triton服务端部署 2.2Triton客户端部署 1. Triton介绍 NVIDIA Triton推理服务器是NVIDIA推出的开源推理框架，主要为用户提供在云和边缘推理上部署的解决方案。 NVIDIA Triton 推理服务器具有以下的特性：支持多种开源框架的部署，包括TensorFlow/PyTorch/ONNX Runtime/TensorRT 等，同时也支持用户提供自定义的服务后端(back...

Triton Inference Server教程2

lansebingxuan的专栏

07-02

4928

本文介绍config文件中的参数配置，如何设置能够提升GPU的利用率，提高模型吞吐

Triton inference server系列(0)——相关资料整理

searobbers_duck的博客

04-23

560

Triton inference server系列(0)——相关资料整理源文档：Triton inference server系列(0)——相关资料整理各release版本信息 NVIDIA TensorRT nvidia的容器仓库：NVIDIA NGC Containers For Deep Learning Frameworks User Guide Pulling A Container NGC Images Running A Container nvidia的开发者blog ...

Triton inference server教程1

lansebingxuan的专栏

06-29

2125

本系列文章是Triton Inference Server部署的详细教程，教程1介绍triton的整体架构以及Model Repository目录文件的准备

TensorRT Inference Server 教程

爱CV

12-07

586

通过一个简单易懂，方便快捷的教程，部署一套完整的深度学习模型，一定程度可以满足部分工业界需求。对于不需要自己重写服务接口的团队来说，使用 tesorrt inference sever 作为服务，也足够了。这里采取的案例是 centernet 检测，SSD，YOLO 系列都比较古老了，虽然教程也比较多，但是都不够简洁而且相对思想比较老，稍微用点新的。本教程使用的检测模型暂时不提供 model zoo，主要原因是官方 release 的 model 都带 DCN 模块，这个模块有 c++ 层面的库，作

深度学习模型服务端部署：Triton server+TensorRT【PyTorch格式----＞ONNX格式----＞TensorRT格式----＞利用Triton server部署】

u013250861的博客

08-01

1740

本来是想着直接用简单的Flask+TensorRT去做服务端的，但是奈何我比较懒，现在已经沉溺于Python，再去花费时间学一个Flask我估摸着时间不够，于是百度之后发现了Tritonserver，这个是NVIDIA自己做的开源产品，支持GRPC和HTTP，还说支持C API直接访问（这部分不了解，相关视频后续在官方教程里会给出）sid=493256最后说一下为什么要选择TensorRT。

nvidia triton server 快速启动随记

howesao的专栏

04-11

1201

0、环境 1)ubuntu20.04 2)docker 3)cuda 11.5 4)jetson4.6.1 5)T4 和驱动 1、quickstart: 1)NVIDIA Container Toolkit curl https://get.docker.com | sh \ && sudo systemctl --now enable docker distribution=$(. /etc/os-release;echo $ID$VERSION_ID) \ &a...

基于Triton Server部署BERT模型

ljp1919的专栏

03-11

6884

背景本文简要介绍如何使用 Triton 部署 BERT模型，主要参考 NVIDIA/DeepLearningExamples 准备工作下载数据进入到/data/DeepLearningExamples-master/PyTorch/LanguageModeling/BERT/data/squad后，下载数据: bash ./squad_download.sh 下载模型 wget --content-disposition https://api.ngc.nvidia.com/v2/models/n

tritonserver学习之二：tritonserver编译

liupenglove的专栏

01-09

1294

【代码】tritonserver学习之三：tritonserver源码编译。

triton inference server

03-16

它支持多种模型格式和框架，并提供了灵活的部署方式，可以在本地或云端部署，支持自动化扩缩容和负载均衡。同时，它还提供了强大的监控和日志功能，便于管理和调试。Triton推理服务器的高性能和可扩展性使其成为工业...