简介
DeepSparse 是一种推理运行时,在 CPU 上性能卓越。例如,与ONNX Runtime 基准相比,DeepSparse 为在同一台机器上运行的 YOLOv5s 提供了 5.8 倍的速度提升!
官网介绍对V5s模型的加速效果如下图所示
加速的原理
deepsaprse加速的原理主要是对模型进行稀疏化处理,主要是通过模型的剪枝和量化来实现这一个目的。他能够保持高精度的同时,大大减少模型的大小从而提高运行时间。
根据官网对自己的介绍:
DeepSparse 具有稀疏感知功能,这意味着它可以跳过已清零的参数,在前向传递中减少计算量。由于稀疏计算现在受内存限制, DeepSparse 按深度执行网络,将问题分解为Tensor Columns,即适合缓存的垂直计算条纹。
安装使用
在其官网上有对应安装和使用方法