AWQ介绍，构思 - PTQ简史(二)

肩口鲲

已于 2024-04-29 00:40:29 修改

阅读量1.2k

点赞数 18

分类专栏：深度学习文章标签：人工智能深度学习算法

于 2024-04-29 00:37:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/EnsDoflamingo/article/details/138294500

版权

前序

GPTQ在量化大模型上取得了巨大的成功，模型部署者而言GPTQ有着一个天然的缺陷 – 校准数据集的过分使用：

其一，量化后模型的领域能力无法同时保持到原有模型的相同水准，不同类型的校准任务无法同时满足，无法同时胜任数学，改写，代码内容的校准。所以目前GPTQ在高产能AIGC的应用寥寥无几。

其二，校准数据过拟合的现象容易发生，过拟合的型仅仅具备校准数据能力。其中的原因是相较于机器学习模型的梯度训练方式，GPTQ方法更类似预测哪些模型权重对当前校准数据影响比较薄弱，从而做出的量化或剪枝行为。不存在类似机器学习模型方法避免过拟合。

综上，大模型PTQ方法倘若摆脱校准数据的依赖，才能在广泛的场景运用和提高效果。于此诞生AWQ(Activation-Aware Weight Quantization)

AWQ

权重不同等重要，保留少数重要的权重，忽视其他权重足以实现量化。提取重要点：AWQ提出激活值判断保留重要的权重。加重重要点：通过输入和权重计算得到的激活值分布，重要的权重后的激活值相对大。随后将重要权重的尺度放大，强化，进一步提高这部分权重的重要性。AWQ几乎不使用校准数据，在量化模型的泛化，多模态等领域取得了显著的改善。

如上图所示，AWQ的量化过程可以分解为从全部权重，到量化权重（提取重要点），最后到放缩量化权重超参数（加重重要点）。

量化权重

最低0.47元/天解锁文章

关注

18
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
AWQ介绍，构思 - PTQ简史(二)

AWQ基于激活值保留量化模型, 绕开了校准数据等PTQ模型量化诸多问题。并且在速度和性能上AWQ也取得了更多的进步，比如量化模型的内核聚合，SIMD-CPU高效利用等。尽管AWQ取得了必要的成功，然而关于AWQ性能实验的充分性，仍然值得更深层次的探索。
复制链接

扫一扫

专栏目录

肩口鲲 CSDN认证博客专家 CSDN认证企业博客

码龄4年

6: 原创

121万+: 周排名

13万+: 总排名

5362: 访问

: 等级

130: 积分

61: 粉丝

70: 获赞

5: 评论

95: 收藏

私信

关注

热门文章

分类专栏

深度学习 2篇

最新评论

LLM内核-快照系统
CSDN-Ada助手: 恭喜作者发布了第5篇博客“LLM内核-快照系统”！不断分享知识和经验对于自己的成长和他人的帮助都是非常宝贵的。在下一篇博客中，或许可以深入探讨快照系统的原理和应用场景，让读者能够更全面地了解这一技术。期待作者更多精彩的创作！
SE4AI测试备受争议的覆盖率法
CSDN-Ada助手: 恭喜作者发布了第四篇博客，标题为“SE4AI测试备受争议的覆盖率法”。这篇博文探讨了备受争议的覆盖率法在SE4AI测试中的运用，引起了很多人的关注和讨论。作者在文章中提出了自己的见解和观点，为读者带来了新的思考角度。希望作者能够继续坚持创作，分享更多有价值的内容。在下一步的创作中，建议可以深入研究备受争议的覆盖率法在SE4AI测试中的实际应用案例，结合具体的数据和案例分析，进一步探讨其优缺点以及改进方法，为读者带来更加全面深入的了解。期待作者的下一篇作品，继续为我们带来新的启发和思考！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
模型量化 - PTQ简史(一）
CSDN-Ada助手: 恭喜作者发表了第三篇博客，标题为“模型量化 - PTQ简史(一）”。阅读了您的文章，对PTQ的简史有了更深刻的了解，感谢您的分享。希望您可以继续坚持创作，分享更多有趣的内容。或许下一篇可以深入探讨PTQ的应用场景或者与其他模型量化方法的对比分析，这样可以让读者有更多的收获。期待您的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
CausalNLP: 文本应用于因果关系
CSDN-Ada助手: 很棒的博文！你对于文本与因果关系的应用做出了很深入的探讨，希望你能继续分享更多类似的内容。另外，除了因果关系，你可能还可以了解一下文本情感分析和主题建模的相关知识，这些都是与文本分析相关的重要技能，也许会对你的研究有所帮助。期待看到你更多的精彩分享！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Nowcoder ‘01‘ 字符串题解
CSDN-Ada助手: 不知道算法技能树是否可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。