![](https://img-blog.csdnimg.cn/direct/b308a82c2cef4fd195a169bf8d3d8819.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
TensorRT模型优化部署
文章平均质量分 95
基础的CUDA知识和TensorRT量化部署等内容,部署至英伟达jeson nano上。
小豆包的小朋友0217
这个作者很懒,什么都没留下…
展开
-
TensorRT优化部署(二)--剖析ONNX架构
本章介绍了ONNX的初步构建方法,后续章节将介绍ONNX注册算子和ONNX推理引擎 -ONNX Runtime。原创 2024-01-04 20:21:49 · 1345 阅读 · 1 评论 -
TensorRT优化部署(一)--TensorRT和ONNX基础
TensorRT模型优化部署相关笔记,专题内容后续有补充。原创 2024-01-04 16:27:22 · 2095 阅读 · 0 评论 -
TensorRT模型优化部署 (八)--模型剪枝Pruning
本章主要讲解了模型剪枝部分内容。自学视频笔记,专题内容后续有补充。本章为专题内容,主要介绍TensorRT优化部署,可移步专题查看其他内容。原创 2024-01-16 21:05:32 · 1985 阅读 · 1 评论 -
TensorRT优化部署(七)--Quantization量化(PTQ and QAT)(二)
理解PTQ和QAT的区别,以及PTQ的优缺点和layer-wise sensitive analysis下节介绍channel-level pruning的算法,以及如何使用L1-Norm来让权重稀疏。原创 2024-01-12 20:02:31 · 2146 阅读 · 1 评论 -
第六章 TensorRT模型优化部署(六)--Quantization量化基础(一)
理解什么叫量化;calibration种类原创 2024-01-12 16:40:44 · 1622 阅读 · 1 评论 -
TensorRT模型优化部署(五)--模型优化部署重点注意
模型部署优化重点注意部分原创 2024-01-07 21:00:38 · 1069 阅读 · 1 评论 -
TensorRT模型优化部署(四)--Roofline model
模型优化部署--Roofline model原创 2024-01-07 20:13:14 · 1380 阅读 · 1 评论 -
TensorRT优化部署(三)--ONNX注册算子
主要介绍ONNX注册算子相关内容,该内容为专栏内容,可进专栏查看其他相关章节。原创 2024-01-06 21:55:48 · 1495 阅读 · 1 评论 -
CUDA初识(二)
nvcc和CUDA平台线程索引相关内容原创 2024-01-04 13:13:23 · 1111 阅读 · 1 评论 -
CUDA初识
CUDA专题内容,后续会继续补充。原创 2024-01-02 14:09:18 · 1020 阅读 · 0 评论