TensorRTpytorch-C部署

1:.pth ------.onnx --------.engine利用的库是volksdep

 部署情况可参考

PyTorch模型的加速及部署 - 知乎

这个里面基本上思路是.pth - onnx -- engine python 部署,同样这个SDK 也有C的部分,但是需要更改。

加载模型的时候,如果有问题,可能是模型插值的一些问题,百度就可以出来。

2: float32-float16-int8

TensorRT INT8量化原理以及如何编写校准器类进行校准_AI数据工厂-CSDN博客

第一节中的部署是float的没有经过量化,一版在边缘部署需要量化加速:

量化需要一个校准器。Calb参考下面连接。

https://gitee.com/skming7216/calibrt

3:不同的机器,生成的int8引擎是大小不一样的,这个和机器的配置有关

配置文件需要计算数据集的均值和方差

计算数据集的均值和方差(mean,std)

https://www.baidu.com/link?url=8gD5x-PcEZbfl2l4jXeDjA-wyHe8qR2B9atqdqf1zpN7hBMq7dqvB0sJ6iwg12YPG2RixaHQsPeD_pSbxsBYJK&wd=&eqid=a4597910000368cd000000056135d364

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值