QDrop 随即丢弃量化激活

xdxd3c

于 2023-12-11 15:43:53 发布

阅读量273

点赞数 8

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xdxd3c/article/details/134928074

版权

本文研究了激活量化在极低比特量化中的作用，发现部分激活量化能提高精度。作者提出QDrop方法，通过随机丢弃激活值量化，在校准和测试数据上优化模型的平坦度，进而改善低比特量化模型的性能。实验结果显示，选择合适的丢弃概率能有效提升模型在测试集的表现。

摘要由CSDN通过智能技术生成

背景

在极低比特的量化中，精度始终无法提升上去。作者团队认为是现有的理论分析只考虑了权重量化，然而忽视了激活的量化。激活量化有利于PTQ在低比特的精度提升，并且作者发现部分的激活量化更有利。

突出贡献

1.证实了激活量化在PTQ重建中的好处，并且令人惊讶地观察到部分参与激活量化的表现优于全部参与。

2.建立了一个理论框架，深入分析了激活量化对权值调谐的影响。利用该框架，优化的低比特模型在校准数据和测试数据上的平坦度对最终精度至关重要。

理论分析

经验观察强调了离线量化中激活值量化的重要性。为了进一步探索激活值量化将如何影响权重微调，作者构建了较为完整的理论框架，通过同时将激活值量化也模拟成噪声来分析最终损失目标。

a）是原本AdaRound和BRECQ的优化目标，（b）是引入激活值量化之后带来的新的一项。在校准数据 X上，对于激活值量化噪声u（x），存在相应的v(x)，使得量化后的模型在v(x)的扰动下更加平坦。回顾之前的三个Case，Case 2和3都引入了激活值量化，额外优化了（b）这一项，并得到了更平坦的量化后模型。

最低0.47元/天解锁文章

关注

8
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

xdxd3c CSDN认证博客专家 CSDN认证企业博客

码龄1年

5: 原创

165万+: 周排名

29万+: 总排名

1108: 访问

: 等级

63: 积分

8: 粉丝

13: 获赞

3: 评论

5: 收藏

私信

关注

热门文章

最新评论

BRECQ
CSDN-Ada助手: “恭喜您在创作领域持续努力，第三篇博客《BRECQ》内容丰富，引人深思。希望您能继续保持创作的热情，探索更多有趣的主题，并尝试不同的写作风格和表达方式，让读者有更丰富的阅读体验。期待您的更多精彩作品。” CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
QDrop 随即丢弃量化激活
CSDN-Ada助手: 恭喜您写了第四篇博客！标题《QDrop 随机丢弃量化激活》非常吸引人，我对您持续创作的热情表示赞赏。在这篇博客中，您介绍了QDrop的概念，这是一个非常有趣和有用的主题。接下来，我想建议您在未来的创作中，可以探讨一下QDrop在实际应用中的效果，并与其他相关技术进行对比。这样的比较将有助于读者更好地理解QDrop的优势和局限性。再次祝贺您，并期待您未来的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
AdaRound
CSDN-Ada助手: 恭喜您的第5篇博客《AdaRound》！看到您持续创作的努力，我感到非常欣慰。您的标题很有趣，引人入胜。在下一步的创作中，或许您可以考虑添加更多的细节和实例，以丰富读者的阅读体验。谦虚地说，我期待着您未来更多精彩的创作！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。