面试八股笔记--TensorRT相关问题

1--TensorRT加速的原理

TensorRT 通过以下操作实现模型的加速:

        ① 垂直合并网络层:经典的一个合并是将 Conv、BN 和 ReLU 三层进行合并为一个层;如果不进行合并,调用这三层结构需要分别调用三次 cuDNN 对应的 API,合并之后只需要调用一次即可;

        ② 水平合并网络层:将输入相同,操作相同的层进行水平合并;

        ③ 支持混合精度:支持 FP16 和 FP32 同时进行推理,也支持 INT8 的量化,加快模型推理速度;

参考1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值