模型压缩开源库整理

最新推荐文章于 2025-04-16 22:08:57 发布

库页

最新推荐文章于 2025-04-16 22:08:57 发布

阅读量2.7k

点赞数 2

分类专栏：深度学习文章标签：模型压缩

本文链接：https://blog.csdn.net/daniaokuye/article/details/82746661

版权

61 篇文章

订阅专栏

Tensorflow Lite：
mxnet - TVM RPC对接移动设备的框架
EAIDK 搭载了 OPEN AI LAB 的核心 AI 开发平台 AID；和②的目标多少有些类似，将面向移动端的接口全部封装。类似于树莓派、arduino甚至安卓将硬件可编程话，一定程度上的封装后，AI方向的需求也开始被封装了。
mxnet自带量化模块
ncnn腾讯的移动端开源框架：https://github.com/Tencent/ncnn
pocketFlow 腾讯的专门用于模型压缩的框架
大厂的发力
1. Nvidia的tensorRT，这里不能忽略一个有相当的集成度的框架，NVcaffe，可剪枝与量化，nvidia维护的caffe版本
2. facebook的Glow，用于推测时inference，集成于pytorch中
3. intel的模型压缩开源框架：neon
4. 处理稀疏矩阵的加速器TCL（Bit-Tactical: Exploiting Ineffectual Computations in Convolutional Neural Networks: Which, Why, and How）
5. 谷歌的TPU-流形的数据处理硬件；这俩都是另外一个方向，重新设计新的硬件，小伙伴们看看热闹就好了
pytorch的tensor-Decomposition
一种量化库：Espresso: Efficient Forward Propagation for BCNNs
Distiller：https://github.com/NervanaSystems/distiller
Tengine：https://github.com/OAID/Tengine 用于移动端设备