大模型技术积累——模型压缩

zRezin

已于 2024-03-17 13:34:58 修改

阅读量520

点赞数 9

分类专栏：大模型文章标签：深度学习大模型

于 2024-03-17 13:14:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shuaikang9864/article/details/136780159

版权

大模型专栏收录该内容

4 篇文章

订阅专栏

本文探讨了模型压缩与加速的关键技术，包括知识蒸馏（如FitNets和Hinton蒸馏）、对抗蒸馏、参数和网络剪枝，以及量化（基础量化和模型量化），展示了如何通过这些方法减小模型复杂性，提升性能和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

总：模型压缩和加速方法

蒸馏（Distillation）

知识蒸馏：使用较大的模型预测结果来知道较小的，结构简单的模型学习。这样可以减小模型复杂度，提高模型的泛化能力和推理速度。

对抗蒸馏：在知识蒸馏的基础上，通过对抗训练来提高模型的鲁棒性和抗干扰能力

剪枝（Pruning）

参数剪枝：删除模型中冗余参数，减少模型大小。原因：一般只有小部分对参数贡献较大（激活函数前一或若干层的模型参数权重分配），其余参数对模型的贡献较小或没有贡献，可以删除冗余参数。

网络剪枝：删除冗余神经元。对比参数剪枝，可以仅删除神经元，不删除对应参数

网络裁剪：对不重要的连接进行裁剪，减少计算开销

量化（Quantization）

基础量化：浮点参数转换为更小的整数或低精度浮点数，减小模型参数和内存占用，提高计算效率

模型量化：模型的权重和激活函数精度从32位浮点数减小到16位浮点或8位整型

分解（Decomposition）

低秩分解（Low-Rank）：将一个较大的权重矩阵分解成几个小的权重矩阵，减少计算开销。代表成果：LoRA，QLoRA

卷积分解（CD）：卷积层分为几个更小的卷积层或全连接层，减小计算开销

分：大模型与知识蒸馏

知识蒸馏模型

FitNets:使用一个较大的模型作为教师（Teacher）来指导一个较小模型（Student）的训练

Hinton蒸馏：使用一个大型模型的输出作为标签来指导小型模型的训练

Born-Again Network（BAN）：使用一个已经选练好的模型来初始化一个新模型，然后使用少年数据重新训练模型

TinyBERT：使用一个大型BERT模型作为教师来指导小型BERT模型的训练

知识蒸馏及其改进方法

知识蒸馏与训练

分：模型量化

To be continue...

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。