(1)终于把TensorRT的engine模型的结构图画出来了! - 知乎
这个需要build时候记录的log以及profile文件
其实我觉得很鸡肋。我们往往需要拿到一个已经生成好的别人的计划文件,因此不可能知道log和profile
(2)第二种方案是利用trt sdk库自带的tools下的polygraphy。
安装方法:
conda activate xxx(你的带有trt的虚拟环境)
cd xxx(你的trt sdk下面的目录与setup.py文件同级目录路径下)
python setup.py install
然后可以基于以下参考:
极智AI | 教你使用深度学习模型调试器 polygraphy - 掘金
TensorRT debug及FP16浮点数溢出问题分析_TracelessLe的专栏-程序员秘密 - 程序员秘密
链接:https://pan.baidu.com/s/1sMum2N8N2rU0WqTM3t4w6Q