轻量化综述（待补充）

最新推荐文章于 2025-04-03 07:31:15 发布

A_my_*

最新推荐文章于 2025-04-03 07:31:15 发布

阅读量673

点赞数 10

分类专栏：轻量化文章标签：深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kyxdjy/article/details/129690319

版权

轻量化途径：

（1）减少内存读写，方法：减少参数量、权重量本身，减少feature map（中间层的输出结果）

（2）内存的读写规则：结构化剪枝（整行整列整通道整channel甚至整层的剪枝，内存读写就是规则的），非结构化剪枝（在feature map中直接进行剔除，这样内存读写就是不规则的）

（3）加速矩阵运算

考虑：参数量、计算量、内存访问量、耗时、能耗、碳排放、 CUDA加速、对抗学习

轻量化分类（把模型部署在终端边缘计算，实时推理）

一、模型瘦身：知识蒸馏权值量化剪枝（权重剪枝、通道剪枝）注意力迁移

（1）知识蒸馏：有一个大的模型可以看成是老师模型，去训练一个小的模型可以看成是学生模型，小模型不断深入模仿大模型，实现模型压缩和部署

（2）模型量化（权重量化）：训练参数的话通常是在一些提供的模型上（Pytorch、TensorFlow）训出来大量几百万的参数（模型的权重）的数据类型都是flow32，会占一定内存，我们通过一种优化手段将这种数据格式量化为占用内存更小，便于计算的数据类型比如说int8这种格式，提高了推理的时间从而提升预测的效率。在同一层之间权重共享，不同层的权重分别进行聚类。原因在于：同一层的权重

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。