深度学习模型加速平台介绍

最新推荐文章于 2023-09-12 20:30:59 发布

一颗大青早

最新推荐文章于 2023-09-12 20:30:59 发布

阅读量602

点赞数

文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LH13471605976/article/details/126035013

版权

英伟达TensorRT

TensorRT是英伟达针对自家的平台用于推理的加速包。在部署的时候用于提升速度。
TensorRT提升速度主要使用两个方面的改进：
1、将数值计算时使用INT8或者FP16而不是FP32，计算可以大大减小计算量，从而达到加速的目的
2、对网络进行重构，把一些可以合并的运算放到一起一起，提升并行度

容易混淆的cuda cudnn

cuda是英伟达开发的一套应用软件接口（API）。其主要应用于英伟达GPU显卡的调用。常用的有cpp和python的API。用户可以通过cuda的API调用GPU进行计算。cuda针对的是并行计算的加速。

cuDNN是英伟达打造的针对深度神经网络的加速库，可以将模型训练的计算优化后，再通过cuda调用进行运算。

openvino 英特尔

OpenVINO是英特尔基于自身现有的硬件平台开发的一种可以加快高性能计算机视觉和深度学习视觉应用开发速度工具套件，支持各种英特尔平台的硬件加速器上进行深度学习，并且允许直接异构执行。支持在Windows与Linux系统，Python/C++语言。

onnxruntime 微软

ONNXRuntime是微软推出的一款推理框架，用户可以非常便利的用其运行一个onnx模型。ONNXRuntime支持多种运行后端包括CPU，GPU，TensorRT，DML等。可以说ONNXRuntime是对ONNX模型最原生的支持。

ncnn 腾讯

ncnn是一个针对移动平台优化的高性能神经网络推理框架，基于该平台，开发者能够轻松将深度学习算法移植到手机端，输出高效的执行。

TNN 腾讯

TNN是腾讯开源的新一代跨平台深度学习推理框架，首个同时支持移动端、桌面端、服务端的全平台开源版本

一颗大青早

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习模型加速平台介绍

深度学习模型加速框架介绍
复制链接

扫一扫

一颗大青早

博客等级

码龄6年

7
原创

7
点赞

52
收藏

8
粉丝

关注

私信

热门文章

最新评论

NMS(non_maximum_suppression)目标检测的非极大值抑制
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
NMS(non_maximum_suppression)目标检测的非极大值抑制
CSDN-Ada助手: 恭喜您写了关于NMS目标检测非极大值抑制的博客！这是一个非常重要的主题，您的讲解非常清晰，让我受益匪浅。希望您能继续保持创作的热情和耐心，不断分享更多深入的技术知识和经验。下一步，我建议您可以深入探讨NMS在不同场景下的应用，或者与其他目标检测算法的对比分析，这将会让您的博客更加丰富和有深度。期待您更多精彩的文章！
win11安装wsl2及linux系统安装anaconda cuda tensorrt
燃生啊: 你好请问一下你这样安装后，能用trtexec的命令吗
openvino推理yolov5,onnx和IR和pytorch对比
Dkcjdjsnx: 博主可以分享代码吗？上个链接或者发邮箱923150875@qq.com，感谢。
openvino推理yolov5,onnx和IR和pytorch对比
小凃老师: 大佬，draw_box_utils 这个文件在哪儿，可以分享一下完整代码吗，感谢。2476312044@qq.com

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。