项目技术路线指导3-week2

最新推荐文章于 2024-10-18 11:21:51 发布

breeze281

最新推荐文章于 2024-10-18 11:21:51 发布

阅读量437

点赞数 5

分类专栏：裁判文书合规性审查项目文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_62069329/article/details/139913198

版权

裁判文书合规性审查项目专栏收录该内容

13 篇文章 0 订阅

订阅专栏

项目技术路线指导-3

该部分主要指导微调方式、保存方式和该过程中量化的优化方式

LORA

LoRA 是一种微调技术，旨在在预训练模型的基础上添加低秩结构，以实现高效的参数化微调。与传统的微调不同，LoRA 不需要修改原始预训练模型的参数，而是添加一个低秩适应层，这使得微调更为参数高效。

模型结构中的 LoRA: 在这段代码中，我们可以看到检查模型是否具有 pretrained_model 属性。如果模型具有这个属性（并且有一个名为 v_head 的属性），这意味着它使用了 LoRA 或某种类似的技术，其中 pretrained_model 可能代表的是预训练的主模型，而其他属性（如 v_head）可能是该模型上的附加头部或部分。

if hasattr(model, "pretrained_model"): # for models with valuehead (currently using LoRA only)

    backbone_model = getattr(model, "pretrained_model")

LoRA 微调类型的检查: 在另一段代码中，我们可以看到检查微调类型是否为 “lora”。根据微调类型，代码执行不同的保存或加载逻辑。

if self.finetuning_args.finetuning_type == "lora":
    backbone_model.save_pretrained(output_dir, state_dict=get_state_dict(backbone_model))

和

if self.finetuning_args.finetuning_type == "lora":
    backbone_model.load_adapter(self.state.best_model_checkpoint, getattr(backbone_model, "active_adapter"))