YOLOv8的deepsparse部署

DeepSparse是一款高性能的CPU推理运行时,为YOLOv8模型提供了显著的加速。与ONNX Runtime相比,YOLOv8s在相同硬件上的速度提升了5.8倍。其加速原理主要通过模型剪枝和量化实现,既能保持高精度,又能减小模型大小,提升运行效率。安装和使用教程可在官网找到,包括CLI用法和权重加载等。
摘要由CSDN通过智能技术生成

简介

DeepSparse 是一种推理运行时,在 CPU 上性能卓越。例如,与ONNX Runtime 基准相比,DeepSparse 为在同一台机器上运行的 YOLOv5s 提供了 5.8 倍的速度提升!
官网介绍对V5s模型的加速效果如下图所示
在这里插入图片描述

加速的原理

deepsaprse加速的原理主要是对模型进行稀疏化处理,主要是通过模型的剪枝和量化来实现这一个目的。他能够保持高精度的同时,大大减少模型的大小从而提高运行时间。
根据官网对自己的介绍:
DeepSparse 具有稀疏感知功能,这意味着它可以跳过已清零的参数,在前向传递中减少计算量。由于稀疏计算现在受内存限制, DeepSparse 按深度执行网络,将问题分解为Tensor Columns,即适合缓存的垂直计算条纹。
在这里插入图片描述

安装使用

在其官网上有对应安装和使用方法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

书中藏着宇宙

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值