Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models

本文是LLM系列文章,针对《Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models》的翻译。

摘要

训练后量化是解决LLM推理中与内存相关的瓶颈的主要方法,但不幸的是,在4位精度以下,它的性能会显著下降。另一种方法是直接以低位宽训练压缩模型(例如,二进制或三进制模型)。然而,这些模型的性能、训练动态和扩展趋势尚未得到很好的理解。为了解决这个问题,我们训练并公开发布了Spectra LLM套件,该套件由54个语言模型组成,参数从99M到3.9B不等,在300Btoken上训练。Spectra包括FloatLM、训练后量化QuantLM(3、4、6和8位)和三元LLM(TriLM),这是我们改进的三元语言建模架构,其性能明显优于之前提出的给定大小(以位为单位)的三元模型,在规模上匹配半精度模型。例如,TriLM 3.9B(位)小于半精度FloatLM 830M,但在常识推理和知识基准测试中与半精度Float LM 3.9B相匹配。然而,TriLM 3.9B的毒性和刻板印象也与尺寸大六倍的FloatLM 3.9B一样。此外,TriLM 3.9B在验证分割和基于网络的语料库方面的困惑程度落后于FloatL

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值