Pruner-Zero: Evolving Symbolic Pruning Metric from scratch for Large Language Models

UnknownBody

于 2024-07-08 14:45:36 发布

阅读量189

点赞数

分类专栏： LLM Daily 文章标签：剪枝语言模型算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/140268482

版权

LLM Daily 专栏收录该内容

1230 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

本文是LLM系列文章，针对《Pruner-Zero: Evolving Symbolic Pruning Metric from scratch for Large Language Models》的翻译。

零修剪：大型语言模型从头开始演化的符号修剪度量

摘要
1 引言
2 相关工作
3 Pruner-Zero框架
4 实验
5 结论

摘要

尽管具有非凡的功能，但大型语言模型（LLM）由于其庞大的规模而面临部署挑战。修剪方法会减少一个子集的权重来加速，但其中许多方法需要重新训练，这是非常昂贵和计算要求很高的。最近，训练后修剪方法引入了新的度量，使LLM的修剪无需再训练。然而，这些指标需要人类专家的参与和繁琐的试错。为了有效地识别高级修剪度量，我们开发了一个使用遗传规划搜索符号修剪度量的自动框架。特别地，我们设计了一个包含现有修剪度量的精细搜索空间，以发现潜在的符号修剪度量。我们提出了一种相反的操作简化策略，以增加人口的多样性。通过这种方式，Pruner Zero允许自动生成符号修剪度量。基于搜索结果，我们探索了修剪度量与修剪后性能之间的相关性，并总结了一些原理。在语言建模和零样本任务上对LLaMA和LLaMA-2进行的大量实验表明，我们的PrunerZero比SOTA后训练修剪方法获得了更好的性能。代码位于：https://github.com/pprp/Pruner-Zero.

1 引言

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。