TensorRT学习-yolov3

最新推荐文章于 2023-01-11 21:57:40 发布

栐木

最新推荐文章于 2023-01-11 21:57:40 发布

阅读量677

点赞数 1

分类专栏： # Deep Learning

本文链接：https://blog.csdn.net/m0_37347379/article/details/106929430

版权

5 篇文章 0 订阅

订阅专栏

参考文献

原始网络：
在这里插入图片描述

Environment：
Drive: 418.87 <> Cuda: 10.1 <> Cudnn: 7.6.5 <> tensorrt: 6.0.1.5

Install：

Pseudocode（伪代码）：
TensorRT-API

创建builder
trt_logger = trt.Logger(trt.Logger.WARNING)
builder = trt.Builder(trt_logger)
通过builder创建一个空的TensorRT网络(Net)
network = builder.create_network()
为这个空的Net添加组件
network.add_input()
network.add_convolution()
…
为builder设置参数
builder.max_workspace_size = 1 << 20
builder.fp16_mode = True
builder.max_batch_size = 16
…
通过这个builder将Net打包成一个engine
engine = builder.build_cuda_engine(network)
如果要是有engine的时候，可以通过以下方式load：
with open(engine_name, “rb”) as f, trt.Runtime(trt_logger) as runtime:
engine = runtime.deserialize_cuda_engine(f.read())
通过engine创建上下文执行环境
context = engine.create_execution_context()
定义自己的output，用于接收tensorRT的输出结果
code