- 博客(1)
- 收藏
- 关注
原创 TRT模型加速推理---随笔记
在TensoRT中,所有的数据都被组成最高四维的数组,如果对应到CNN中其实就是{N, C, H, W},N表示batch size,即多少张图片或者多少个推断(Inference)的实例;一个深度学习模型,在没有优化的情况下,比如一个卷积层、一个偏置层和一个reload层,这三层是需要调用三次cuDNN对应的API,但实际上这三层的实现完全是可以合并到一起的,TensorRT会对一些可以合并网络进行合并。.pt--->.onnx,一般来说官方有对应方法。编写脚本.onnx--->.engine。
2023-09-15 16:00:54
591
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人