【论文阅读】Q8BERT: Quantized 8Bit BERT
于 2022-06-25 16:19:27 首次发布
Q8BERT通过引入对称线性量化和量化感知训练(QAT),成功将BERT模型压缩4倍,同时保持较小的精度损失。在与动态量化(DQ)方法对比中,QAT在多数任务上的准确率下降不超过1%,显示了其在模型压缩领域的优势。
摘要由CSDN通过智能技术生成