TensorRT自带的trtexec在bin目录下,是一个可执行文件。
运行./trtexec -h
其中给出了 model options、build options、 inference options和system options等。
上次我们使用TensorRT的pyhton API进行序列化模型和前向推理,这次介绍使用trtexec转模型。
- 从固定尺寸的onnx转cudaEngine
./trtexec --explicitBatch --onnx=./resnet50.onnx --saveEngine=resnet50.engine
- 从可变尺寸的onnx转cudaEngine,需要指定profile。
./trtexec --onnx=./resnet50_dynamic.onnx --explicitBatch \
--minShapes="input":1x3x224x224