LoRA与量化技术结合：QPiSSA方法降低量化误差的优势分析_qlora之后还有哪些关于lora量化的-CSDN博客

本文链接：https://blog.csdn.net/weixin_41046245/article/details/140007107

LoRA与量化技术结合：QPiSSA方法降低量化误差的优势分析

量化技术：
量化技术是指将矩阵的值域划分为若干连续区域，并将每个区域内的所有值映射为相同的“量化”值。量化技术的主要目的是减少前向传播的内存消耗。这在深度学习中是一个重要的问题，因为随着模型的复杂性增加，内存消耗也会急剧增加。然而，量化技术在反向传播中会遇到问题，主要是因为量化后的梯度计算不够精确。

LoRA技术：
LoRA（Low-Rank Adaptation）是一种通过引入低秩适配器来减少反向传播内存需求的方法。LoRA的核心思想是将模型参数分解成低秩形式，保留高精度的适配器，以便在反向传播时能够精确地更新参数。因此，LoRA可以与量化技术结合使用，量化基本模型以提高前向传播的内存效率，同时保持LoRA适配器的全精度以保证反向传播的准确性。

QLoRA方法

QLoRA的工作原理：
QLoRA（Quantized LoRA）将基本模型量化为Normal Float 4-bit（NF4），并使用高斯零初始化来初始化全精度的A和B。QLoRA的量化误差公式如下：
$\text{Quantization Error of QLoRA} = \|W - (\text{nf4}(W) + AB)\|_* = \|W - \text{nf4}(W)\|_*$
其中， $M\|_*)$ 表示核范数（也称迹范数），定义为：
$\|M\|_* = \text{trace}(\sqrt{M^*M}) = \sum_{i=1}^{\min\{m,n\}} \sigma_i(M)$
这里， $(\sigma_i(M))$ 是矩阵M的第i个奇异值。

QPiSSA方法

QPiSSA的工作原理：
QPiSSA（Quantized PiSSA）与QLoRA不同，不对基本模型W进行量化，而是对残差模型Wres进行量化。QPiSSA的量化误差公式如下：
$\text{Quantization Error of QPiSSA} = \|W - (\text{nf4}(Wres) + AB)\|_* = \|Wres - \text{nf4}(Wres)\|_*$