本文是LLM系列文章,针对《DLoRA: Distributed Parameter-Efficient Fine-Tuning Solution for Large
Language Model》的翻译。
摘要
为了提高大型语言模型(LLM)在下游任务上的性能,一种解决方案是微调某些LLM参数,使其更好地与训练数据集的特征相一致。这个过程通常被称为参数高效微调(PEFT)。由于LLM的规模,PEFT操作通常在公共环境(例如云服务器)中执行。这需要在公共环境中共享敏感的用户数据,从而引发潜在的隐私问题。为了应对这些挑战,我们提出了一个名为DLoRA的分布式PEFT框架。DLoRA使可扩展的PEFT操作能够在云和用户设备之间协同执行。结合所提出的Kill and Revive算法,评估结果表明,DLoRA可以显著减少用户设备的计算和通信工作量,同时实现卓越的准确性和隐私保护。